👥Práctica Grupal–Encuesta CIS📑

Author

Hugo Alonso, Gonzalo Blanca, Pablo Galarón, Raúl Palomo

Introducción 📢

Para analizar y contrastar la afirmación recogida en la noticia de El País (15/01/2024), según la cual “un 44% de los hombres cree que se ha llegado tan lejos en la promoción de la igualdad de las mujeres que ahora se les discrimina a ellos”, hemos seleccionado un conjunto de variables del Estudio CIS nº 3428 que nos permitirán explorar tanto la percepción subjetiva de discriminación como las condiciones objetivas de desigualdad de género.

LAS VARIABLES SELECCIONADAS SON:

  • SEXO, EDAD, TAMUNI, INGRESHOG, SITLAB, NIVELESTENTREV, RELIGION, ESCIDEOL, ESCFEMINIS, RECUVOTOG → variables sociodemográficas y de contexto para analizar cómo influyen el género, la edad, la clase social, la ideología, la religiosidad y la afinidad política en la percepción de discriminación.

  • P6_2 → pregunta central que mide si las personas creen que los hombres están ahora discriminados.

  • P4, P7_1, P7_2, P7_3 → percepción de desigualdad real en salarios, ascensos y oportunidades laborales.

  • TARHOGENTREV_HH, CUIDADOHIJOS_HH, HIJOMENOR → indicadores objetivos de reparto de tareas domésticas, cuidado y carga familiar.

Objetivo del análisis 🎯

Buscamos comprobar si quienes perciben discriminación hacia los hombres presentan diferencias reales en:

  • reparto de tareas domésticas,

  • participación en el cuidado de hijos y personas dependientes,

  • nivel de desigualdad material y laboral que reconocen.

Note

Además, esperamos que durante el proceso de depuración aparezcan evidencias que muestren si esa percepción depende más de factores ideológicos (ESCIDEOL, ESCFEMINIS, RELIGION, RECUVOTOG) que de la situación objetiva.

Hipótesis iniciales 💡

Es probable que sean más los hombres que las mujeres quienes perciban discriminación contra los hombres.

Esperamos encontrar que quienes expresan esa percepción:

  • dedican menos tiempo al hogar y al cuidado que sus parejas mujeres,

  • reconocen menos desigualdad en salario y oportunidades laborales,

  • se ubican ideológicamente más a la derecha y son menos afines al feminismo.

Los factores objetivos (ingresos, hijos, tareas domésticas) probablemente no expliquen esa percepción tanto como los factores ideológicos.

Librerías 📚

library(tidyverse)
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr     1.1.4     ✔ readr     2.1.5
✔ forcats   1.0.0     ✔ stringr   1.5.0
✔ ggplot2   3.5.1     ✔ tibble    3.2.1
✔ lubridate 1.9.3     ✔ tidyr     1.3.1
✔ purrr     1.0.2     
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag()    masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(skimr)
library(patchwork)
library(class)
library(dbscan)

Attaching package: 'dbscan'

The following object is masked from 'package:stats':

    as.dendrogram
library(naniar)

Attaching package: 'naniar'

The following object is masked from 'package:skimr':

    n_complete
library(psych)

Attaching package: 'psych'

The following objects are masked from 'package:ggplot2':

    %+%, alpha
library(VIM)
Loading required package: colorspace
Loading required package: grid
VIM is ready to use.

Suggestions and bug-reports can be submitted at: https://github.com/statistikat/VIM/issues

Attaching package: 'VIM'

The following object is masked from 'package:dbscan':

    kNN

The following object is masked from 'package:datasets':

    sleep
library(mice)
Warning in check_dep_version(): ABI version mismatch: 
lme4 was built with Matrix ABI version 1
Current Matrix ABI version is 0
Please re-install lme4 from source or restore original 'Matrix' package

Attaching package: 'mice'

The following object is masked from 'package:stats':

    filter

The following objects are masked from 'package:base':

    cbind, rbind

Carga de datos y selección de variables

Cargamos la base de datos con read_csv2 que nos identifica el ; como delimitador.

data_num <- read_csv2(file = "../entrega_grupal/MD3428/3428_csv/3428_num.csv") |> 
  mutate(HIJOMENOR = if_else(HIJOMENOR_99 == 1, NA, HIJOMENOR_1))
ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
Rows: 4005 Columns: 232
── Column specification ────────────────────────────────────────────────────────
Delimiter: ";"
dbl (230): ESTU, REGISTRO, CUES, CCAA, PROV, MUN, CAPITAL, TAMUNI, ENTREV, T...
lgl   (2): IA_OBS1, IA_OBS2

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Important
  • Nos dimos cuenta de que la variable original HIJOMENOR estaba mal codificada y no reflejaba bien la realidad.
  • Por eso, usamos HIJOMENOR_1 (si tiene hijos menores) y HIJOMENOR_99 (si respondió la pregunta) para reconstruirla.
  • Con este código, asignamos NA a quienes no contestaron y usamos el valor correcto de quienes sí respondieron. Así aseguramos que la variable esté limpia y lista para el análisis.

Seleccionamos las variables que hemos dicho antes.

data_num <- data_num |> 
  select(
    SEXO,           # P0a → Sexo
    EDAD,          # P0b → Edad
    TAMUNI,        # Tamaño del municipio
    INGRESHOG,     # P29 → Ingresos del hogar
    TARHOGENTREV_HH, # Horas dedicadas al hogar (persona entrevistada)
    HIJOMENOR,    # Tiene hijos menores o no
    SITLAB,         # P28 → Situación laboral
    NIVELESTENTREV, # P26a → Nivel de estudios
    P6_2,          # Opinión: se discrimina a hombres
    P4,            # Grado de desigualdad en España
    P7_1,         # Salarios mujeres vs hombres
    P7_2,         # Ascenso laboral mujeres vs hombres
    P7_3,         # Oportunidades empleo mujeres vs hombres
    ESCFEMINIS,    # Escala autodefinición feminista
    ESCIDEOL,      # Escala ideológica
    RELIGION,      # Religiosidad
    CUIDADOHIJOS_HH, # Horas cuidado hijos/as
    RECUVOTOG # Recuerdo de voto en elecciones generales
  )

¿De que tipo son nuestras variables?

Las variables son las siguientes:

CUALITATIVAS

  • SEXO → cualitativa nominal (sexo del entrevistado)

  • TAMUNI → cualitativa ordinal (tamaño del municipio)

  • INGRESHOG → cualitativa ordinal (ingresos del hogar)

  • HIJOMENOR → cualitativa nominal (si tiene hijos/as menores)

  • SITLAB → cualitativa nominal (situación laboral)

  • NIVELESTENTREV → cualitativa nominal (nivel de estudios)

  • GRADACDISC(p6_2) → cualitativa ordinal (grado de acuerdo de la afirmación)

  • GRADODESIGUALDAD(p4) → cualitativa ordinal (grado de desigualdad percibida entre hombres y mujeres en España)

  • VALSALARIOS(p7_1) → cualitativa ordinal (valoración de la situación de las mujeres respecto de los hombres en los salarios)

  • VALPOSASC(p7_2) → cualitativa ordinal (valoración de la situación de las mujeres respecto de los hombres en las posibilidades de ascenso en el trabajo)

  • VALOPEMP(p7_3) → cualitativa ordinal (valoración de la situación de las mujeres respecto de los hombres en las oportunidades para encontrar empleo)

  • RELIGION → cualitativa nominal (religión declarada)

  • RECUVOTOG → cualitativa nominal (recuerdo de voto)

CUANTITATIVAS

  • EDAD → cuantitativa discreta (edad en años)

  • TARHOGENTREV_HH → cuantitativa discreta (horas dedicadas al hogar)

  • ESCFEMINIS → cuantitativa discreta (escala sobre feminismo 0–10)

  • ESCIDEOL → cuantitativa discreta (escala ideológica 0–10)

  • CUIDADOHIJOS_HH → cuantitativa discreta (horas dedicadas al cuidado de hijos)

Recodificación de las variables ♻️

Este proceso es clave porque, si lo hacemos bien ahora, nos ahorrará mucho tiempo y problemas en el análisis posterior.

NS/NS/NO PROCEDE ->> NA

En este paso calculamos el porcentaje de respuestas “No sabe / No contesta” para cada variable y, al comprobar que es bajo, las recodificamos como NA. Esto limpia la base de datos y nos permite trabajar solo con respuestas válidas en los análisis posteriores.

Note

Hemos tenido en cuenta el significado de cada variable para decidir si recodificar las respuestas “No sabe / No contesta” como NA o mantenerlas como una categoría válida. Por ejemplo, en RECUVOTOG, nos interesa conservar el “No contesta” como categoría analizable, mientras que el “No recuerda” lo recodificamos como NA porque no aporta información útil al análisis.

variables_analizar <- c(
  "SEXO", "EDAD", "TAMUNI", "INGRESHOG", "TARHOGENTREV_HH",
  "HIJOMENOR", "SITLAB", "NIVELESTENTREV", "P6_2", "P4", "P7_1", "P7_2",
  "P7_3", "ESCFEMINIS", "ESCIDEOL", "RELIGION", "CUIDADOHIJOS_HH", "RECUVOTOG"
)

# Recorremos cada variable y mostramos proporciones
for (var in variables_analizar) {
  cat("\nVariable:", var, "\n")
  print(prop.table(table(data_num[[var]])))
}

Variable: SEXO 

        1         2 
0.5026217 0.4973783 

Variable: EDAD 

          16           17           18           19           20           21 
0.0027465668 0.0039950062 0.0114856429 0.0072409488 0.0084893883 0.0079900125 
          22           23           24           25           26           27 
0.0112359551 0.0134831461 0.0137328340 0.0117353308 0.0094881398 0.0102372035 
          28           29           30           31           32           33 
0.0137328340 0.0107365793 0.0159800250 0.0129837703 0.0152309613 0.0177278402 
          34           35           36           37           38           39 
0.0142322097 0.0152309613 0.0129837703 0.0154806492 0.0194756554 0.0159800250 
          40           41           42           43           44           45 
0.0237203496 0.0174781523 0.0202247191 0.0222222222 0.0207240949 0.0179775281 
          46           47           48           49           50           51 
0.0174781523 0.0224719101 0.0214731586 0.0222222222 0.0242197253 0.0179775281 
          52           53           54           55           56           57 
0.0259675406 0.0207240949 0.0147315855 0.0214731586 0.0187265918 0.0167290886 
          58           59           60           61           62           63 
0.0234706617 0.0177278402 0.0197253433 0.0137328340 0.0134831461 0.0137328340 
          64           65           66           67           68           69 
0.0127340824 0.0194756554 0.0154806492 0.0149812734 0.0152309613 0.0109862672 
          70           71           72           73           74           75 
0.0127340824 0.0082397004 0.0084893883 0.0079900125 0.0104868914 0.0104868914 
          76           77           78           79           80           81 
0.0139825218 0.0129837703 0.0084893883 0.0092384519 0.0127340824 0.0042446941 
          82           83           84           85           86           87 
0.0044943820 0.0064918851 0.0032459426 0.0032459426 0.0034956305 0.0027465668 
          88           89           90           91           92           93 
0.0019975031 0.0014981273 0.0014981273 0.0002496879 0.0009987516 0.0002496879 
          94           97 
0.0004993758 0.0002496879 

Variable: TAMUNI 

         1          2          3          4          5          6          7 
0.04744070 0.11910112 0.24619226 0.13757803 0.24794007 0.08813983 0.11360799 

Variable: INGRESHOG 

         1          2          3          4          5          6          8 
0.10187266 0.14856429 0.22247191 0.21947566 0.17877653 0.08214732 0.02022472 
         9 
0.02646692 

Variable: TARHOGENTREV_HH 

           0            1            2            3            4            5 
0.0816479401 0.2369538077 0.2851435705 0.1635455680 0.0828963795 0.0456928839 
           6            7            8            9           10           11 
0.0244694132 0.0077403246 0.0099875156 0.0009987516 0.0049937578 0.0004993758 
          12           14           15           16           18           24 
0.0019975031 0.0002496879 0.0002496879 0.0002496879 0.0002496879 0.0014981273 
          98           99 
0.0369538077 0.0139825218 

Variable: HIJOMENOR 

        1         2 
0.2669502 0.7330498 

Variable: SITLAB 

          1           2           3           4           5           6 
0.592509363 0.216729089 0.021722846 0.074906367 0.004244694 0.043945069 
          7           8           9 
0.031960050 0.012734082 0.001248439 

Variable: NIVELESTENTREV 

          0           1           2           3           4           5 
0.004244694 0.005992509 0.039200999 0.003495630 0.122846442 0.067665418 
          6           7           8           9          10          11 
0.146067416 0.129088639 0.018976280 0.071161049 0.061173533 0.158302122 
         12          13          14          15          16          98 
0.030961298 0.093383271 0.023470662 0.012234707 0.008739076 0.002996255 

Variable: P6_2 

          1           2           3           4           5           8 
0.188264669 0.194257179 0.009238452 0.275156055 0.325343321 0.004744070 
          9 
0.002996255 

Variable: P4 

         1          2          3          4          8          9 
0.15880150 0.41972534 0.26067416 0.13533084 0.01373283 0.01173533 

Variable: P7_1 

          1           2           3           8           9 
0.034706617 0.330337079 0.615480649 0.016479401 0.002996255 

Variable: P7_2 

          1           2           3           8           9 
0.066666667 0.323845194 0.589263421 0.013732834 0.006491885 

Variable: P7_3 

          1           2           3           8           9 
0.089138577 0.432209738 0.462172285 0.012734082 0.003745318 

Variable: ESCFEMINIS 

          0           1           2           3           4           5 
0.086392010 0.011235955 0.012234707 0.022971286 0.026966292 0.198252185 
          6           7           8           9          10          98 
0.088888889 0.162546816 0.192259675 0.073907615 0.109612984 0.007740325 
         99 
0.006991261 

Variable: ESCIDEOL 

         1          2          3          4          5          6          7 
0.11310861 0.07890137 0.14082397 0.09438202 0.20174782 0.07240949 0.08888889 
         8          9         10         98         99 
0.08064919 0.01772784 0.05692884 0.01622971 0.03820225 

Variable: RELIGION 

         1          2          3          4          5          6          9 
0.15880150 0.34257179 0.03345818 0.14781523 0.12958801 0.17278402 0.01498127 

Variable: CUIDADOHIJOS_HH 

           0            1            2            3            4            5 
0.0147315855 0.0269662921 0.0401997503 0.0319600499 0.0292134831 0.0272159800 
           6            7            8            9           10           11 
0.0207240949 0.0102372035 0.0157303371 0.0034956305 0.0042446941 0.0002496879 
          12           13           14           15           16           17 
0.0084893883 0.0004993758 0.0012484395 0.0004993758 0.0032459426 0.0002496879 
          18           19           20           21           24           96 
0.0022471910 0.0002496879 0.0004993758 0.0002496879 0.0077403246 0.7335830212 
          98           99 
0.0122347066 0.0039950062 

Variable: RECUVOTOG 

          0           1           2           3           6          21 
0.154806492 0.246691635 0.213233458 0.066167291 0.003745318 0.130836454 
        503         901         902        1201        1501        1601 
0.003995006 0.016479401 0.011235955 0.008489388 0.001498127 0.006741573 
       1602        8995        8996        9977        9998        9999 
0.008489388 0.014731586 0.011735331 0.005493134 0.011235955 0.084394507 
data_num <- data_num |> 
  mutate(
    INGRESHOG = ifelse(INGRESHOG %in% c(8, 9), NA, INGRESHOG),
    TARHOGENTREV_HH = ifelse(TARHOGENTREV_HH %in% c(98, 99), NA, TARHOGENTREV_HH),
    SITLAB = ifelse(SITLAB == 9, NA, SITLAB),
    NIVELESTENTREV = ifelse(NIVELESTENTREV %in% c(98, 99), NA, NIVELESTENTREV),
    P6_2 = ifelse(P6_2 %in% c(8, 9), NA, P6_2),
    P4 = ifelse(P4 %in% c(8, 9), NA, P4),
    P7_1 = ifelse(P7_1 %in% c(8, 9), NA, P7_1),
    P7_2 = ifelse(P7_2 %in% c(8, 9), NA, P7_2),
    P7_3 = ifelse(P7_3 %in% c(8, 9), NA, P7_3),
    ESCFEMINIS = ifelse(ESCFEMINIS %in% c(98, 99), NA, ESCFEMINIS),
    ESCIDEOL = ifelse(ESCIDEOL %in% c(98, 99), NA, ESCIDEOL),
    RELIGION = ifelse(RELIGION == 9, NA, RELIGION),
    CUIDADOHIJOS_HH = ifelse(CUIDADOHIJOS_HH %in% c(96, 98, 99), NA, CUIDADOHIJOS_HH), #TENER EN CUENTA EL 16 PARA FUTUROS ANÁLISIS, depende de si responde que tiene hijos o no, var hijomenor
    RECUVOTOG = ifelse(RECUVOTOG == 9998, NA, RECUVOTOG)
  )
Important
  • En el análisis observamos que el valor 96 tiene un porcentaje muy alto en la variable CUIDADOSHIJOS_HH, pero aun así decidimos recodificarlo como NA. Esto se debe a que este valor representa a personas que no tienen hijos, por lo que la variable depende directamente de HIJOMENOR. Cuando trabajemos con esta variable en análisis futuros, no vamos a imputar los NA; en su lugar, filtraremos los datos usando la variable HIJOMENOR para asegurarnos de incluir solo los casos relevantes.

  • Sucede lo mismo con la variable RECUVOTOG, donde el 0 significa los que no tenemos info de su voto, pero en vez de pasarlo a na nos creamos un tipo nuevo porque tenemos la suerte de que es cualitativa y no afecta igual que con las cuantitativas.

Conversión a factores con labels

Recodificamos las variables cualitativas. Las variables P…, las ponemos un nombre acorde a su significado.

data_num <- 
  data_num |> 
  rename(GRADACDISC = P6_2,
         GRADODESIGUALDAD = P4,
         VALSALARIOS = P7_1,
         VALPOSASC = P7_2,
         VALOPEMP = P7_3)
data_num <- data_num |> 
  mutate(
    SEXO = factor(SEXO, levels = c(1, 2), labels = c("Hombre", "Mujer")),  # nominal
    TAMUNI = factor(TAMUNI, 
                levels = 7:1, 
                labels = c(">1000000 habitantes", 
                           "400001-1000000 habitantes", 
                           "100001-400000 habitantes", 
                           "50001-100000 habitantes", 
                           "10001-50000 habitantes", 
                           "2001-10000 habitantes", 
                           "≤2000 habitantes"),
                ordered = TRUE),  # ordinal
    INGRESHOG = factor(INGRESHOG, levels = 1:6,
                       labels = c("Más de 5000€", 
                                  "3901-5000€", 
                                  "2701-3900€", 
                                  "1801-2700€", 
                                  "1100-1800€", 
                                  "Menos de 1100€"),
                       ordered = TRUE),  # ordinal
    HIJOMENOR = factor(HIJOMENOR, levels = c(1, 2),
                       labels = c("Tiene hijos/as menores", "Ninguno")), # nominal 
    SITLAB = factor(SITLAB, levels = 1:8,
                    labels = c("Trabaja", 
                               "Jubilado/a o pensionista (ha trabajado)", 
                               "Pensionista (no ha trabajado)", 
                               "En paro, ha trabajado antes", 
                               "En paro, busca primer empleo", 
                               "Estudiante", 
                               "Trabajo doméstico no remunerado", 
                               "Otra situación")),  # nominal
    NIVELESTENTREV = factor(NIVELESTENTREV, levels = 1:16,
                            labels = c("Menos de 5 años escolarización", 
                                       "Primaria", 
                                       "FP básica", 
                                       "Educación secundaria", 
                                       "FP grado medio", 
                                       "Bachillerato", 
                                       "FP grado superior", 
                                       "Arquitectura/ingeniería técnica", 
                                       "Diplomaturas oficiales", 
                                       "Grado universitario", 
                                       "Licenciatura", 
                                       "Arquitectura/ingeniería", 
                                       "Máster oficial", 
                                       "Doctorado", 
                                       "Títulos propios posgrado", 
                                       "Otros estudios")),  # nominal
    GRADACDISC = factor(GRADACDISC, 
                      levels = 5:1, 
                      labels = c("Nada de acuerdo", 
                                 "Poco de acuerdo", 
                                 "Regular", 
                                 "Bastante de acuerdo", 
                                 "Muy de acuerdo"),
                      ordered = TRUE),  # ordinal
    GRADODESIGUALDAD = factor(GRADODESIGUALDAD, 
                          levels = 4:1, 
                          labels = c("Casi inexistentes", 
                                     "Pequeñas", 
                                     "Bastante grandes", 
                                     "Muy grandes"),
                          ordered = TRUE),  # ordinal
    VALSALARIOS = factor(VALSALARIOS, levels = 3:1,
                            labels = c("Peor", "Igual", "Mejor"),
                            ordered = TRUE),  # ordinal
    VALPOSASC = factor(VALPOSASC, levels = 3:1,
                          labels = c("Peor", "Igual", "Mejor"),
                          ordered = TRUE),  # ordinal
    VALOPEMP = factor(VALOPEMP, levels = 3:1,
                         labels = c("Peor", "Igual", "Mejor"),
                         ordered = TRUE),  # ordinal
    RELIGION = factor(RELIGION,  levels = 1:6,
                      labels = c("Católico/a practicante", 
                                 "Católico/a no practicante", 
                                 "Creyente de otra religión", 
                                 "Agnóstico/a", 
                                 "Indiferente, no creyente", 
                                 "Ateo/a")),  # nominal
    RECUVOTOG = factor(RECUVOTOG, levels = c(1, 2, 3, 6, 21, 503, 901, 902, 1201, 1501, 1601, 1602,
             8995, 8996, 9977, 9999),
  labels = c(
    'PSOE (PSC, PSE-EE, PSdeG, PSIB, PSN)',
    'PP',
    'VOX',
    'PACMA',
    'SUMAR (Podemos, IU, Más País, etc.)',
    'CCa (Coalición Canaria)',
    'ERC (Esquerra Republicana)',
    'JUNTS (Junts per Catalunya)',
    'BNG (Bloque Nacionalista Galego)',
    'UPN (Unión del Pueblo Navarro)',
    'EAJ-PNV (Partido Nacionalista Vasco)',
    'EH Bildu (Euskal Herria Bildu)',
    'Otro partido',
    'En blanco',
    'Voto nulo',
    'N.C.'))  # nominal
  )
  • Comprobamos
data_num |>  distinct(SEXO)
# A tibble: 2 × 1
  SEXO  
  <fct> 
1 Mujer 
2 Hombre
data_num |>  distinct(TAMUNI)
# A tibble: 7 × 1
  TAMUNI                   
  <ord>                    
1 100001-400000 habitantes 
2 2001-10000 habitantes    
3 10001-50000 habitantes   
4 50001-100000 habitantes  
5 ≤2000 habitantes         
6 400001-1000000 habitantes
7 >1000000 habitantes      
data_num |>  distinct(INGRESHOG)
# A tibble: 7 × 1
  INGRESHOG     
  <ord>         
1 2701-3900€    
2 1801-2700€    
3 <NA>          
4 1100-1800€    
5 Más de 5000€  
6 3901-5000€    
7 Menos de 1100€
data_num |>  distinct(HIJOMENOR) 
# A tibble: 3 × 1
  HIJOMENOR             
  <fct>                 
1 Tiene hijos/as menores
2 Ninguno               
3 <NA>                  
data_num |>  distinct(SITLAB)
# A tibble: 9 × 1
  SITLAB                                 
  <fct>                                  
1 Trabaja                                
2 Estudiante                             
3 En paro, ha trabajado antes            
4 Trabajo doméstico no remunerado        
5 En paro, busca primer empleo           
6 Jubilado/a o pensionista (ha trabajado)
7 Otra situación                         
8 Pensionista (no ha trabajado)          
9 <NA>                                   
data_num |>  distinct(NIVELESTENTREV)
# A tibble: 17 × 1
   NIVELESTENTREV                 
   <fct>                          
 1 Grado universitario            
 2 FP grado superior              
 3 Diplomaturas oficiales         
 4 Bachillerato                   
 5 Máster oficial                 
 6 Educación secundaria           
 7 Doctorado                      
 8 Primaria                       
 9 FP grado medio                 
10 Licenciatura                   
11 Menos de 5 años escolarización 
12 Arquitectura/ingeniería técnica
13 Arquitectura/ingeniería        
14 FP básica                      
15 Títulos propios posgrado       
16 <NA>                           
17 Otros estudios                 
data_num |>  distinct(GRADACDISC)
# A tibble: 6 × 1
  GRADACDISC         
  <ord>              
1 Nada de acuerdo    
2 Muy de acuerdo     
3 Poco de acuerdo    
4 Bastante de acuerdo
5 Regular            
6 <NA>               
data_num |>  distinct(GRADODESIGUALDAD)
# A tibble: 5 × 1
  GRADODESIGUALDAD 
  <ord>            
1 Muy grandes      
2 Pequeñas         
3 Bastante grandes 
4 Casi inexistentes
5 <NA>             
data_num |>  distinct(VALSALARIOS)
# A tibble: 4 × 1
  VALSALARIOS
  <ord>      
1 Peor       
2 Igual      
3 Mejor      
4 <NA>       
data_num |>  distinct(VALPOSASC)
# A tibble: 4 × 1
  VALPOSASC
  <ord>    
1 Peor     
2 Igual    
3 Mejor    
4 <NA>     
data_num |>  distinct(VALOPEMP)
# A tibble: 4 × 1
  VALOPEMP
  <ord>   
1 Peor    
2 Igual   
3 Mejor   
4 <NA>    
data_num |>  distinct(RELIGION)
# A tibble: 7 × 1
  RELIGION                 
  <fct>                    
1 Católico/a practicante   
2 Católico/a no practicante
3 Ateo/a                   
4 Agnóstico/a              
5 Indiferente, no creyente 
6 <NA>                     
7 Creyente de otra religión
data_num |>  distinct(RECUVOTOG)
# A tibble: 17 × 1
   RECUVOTOG                           
   <fct>                               
 1 <NA>                                
 2 PP                                  
 3 PSOE (PSC, PSE-EE, PSdeG, PSIB, PSN)
 4 Otro partido                        
 5 En blanco                           
 6 SUMAR (Podemos, IU, Más País, etc.) 
 7 N.C.                                
 8 VOX                                 
 9 Voto nulo                           
10 PACMA                               
11 CCa (Coalición Canaria)             
12 ERC (Esquerra Republicana)          
13 JUNTS (Junts per Catalunya)         
14 BNG (Bloque Nacionalista Galego)    
15 EAJ-PNV (Partido Nacionalista Vasco)
16 EH Bildu (Euskal Herria Bildu)      
17 UPN (Unión del Pueblo Navarro)      
str(data_num)
tibble [4,005 × 18] (S3: tbl_df/tbl/data.frame)
 $ SEXO            : Factor w/ 2 levels "Hombre","Mujer": 2 2 2 2 2 2 2 2 1 1 ...
 $ EDAD            : num [1:4005] 28 60 50 41 19 52 64 45 41 60 ...
 $ TAMUNI          : Ord.factor w/ 7 levels ">1000000 habitantes"<..: 3 3 3 3 3 3 3 3 3 3 ...
 $ INGRESHOG       : Ord.factor w/ 6 levels "Más de 5000€"<..: 3 4 3 3 NA 5 1 3 4 3 ...
 $ TARHOGENTREV_HH : num [1:4005] 3 3 5 2 2 2 5 2 3 1 ...
 $ HIJOMENOR       : Factor w/ 2 levels "Tiene hijos/as menores",..: 1 2 2 1 2 2 2 2 1 2 ...
 $ SITLAB          : Factor w/ 8 levels "Trabaja","Jubilado/a o pensionista (ha trabajado)",..: 1 1 1 1 6 4 7 6 1 1 ...
 $ NIVELESTENTREV  : Factor w/ 16 levels "Menos de 5 años escolarización",..: 10 7 7 9 6 13 6 4 7 14 ...
 $ GRADACDISC      : Ord.factor w/ 5 levels "Nada de acuerdo"<..: 1 5 1 1 2 4 1 2 1 5 ...
 $ GRADODESIGUALDAD: Ord.factor w/ 4 levels "Casi inexistentes"<..: 4 2 3 2 3 2 3 4 4 2 ...
 $ VALSALARIOS     : Ord.factor w/ 3 levels "Peor"<"Igual"<..: 1 1 2 2 2 1 2 1 1 2 ...
 $ VALPOSASC       : Ord.factor w/ 3 levels "Peor"<"Igual"<..: 1 1 2 1 1 1 2 1 1 3 ...
 $ VALOPEMP        : Ord.factor w/ 3 levels "Peor"<"Igual"<..: 1 2 1 1 2 2 2 2 1 3 ...
 $ ESCFEMINIS      : num [1:4005] 8 7 8 7 7 5 10 10 10 0 ...
 $ ESCIDEOL        : num [1:4005] 10 5 3 4 3 10 1 NA 5 5 ...
 $ RELIGION        : Factor w/ 6 levels "Católico/a practicante",..: 1 1 2 6 4 1 2 4 6 1 ...
 $ CUIDADOHIJOS_HH : num [1:4005] 7 NA NA 12 NA NA NA NA 4 NA ...
 $ RECUVOTOG       : Factor w/ 16 levels "PSOE (PSC, PSE-EE, PSdeG, PSIB, PSN)",..: NA 2 1 1 1 2 1 13 14 NA ...

COMPROBADO, BIEN RECODIFICADAS

Errores ⚠️

Las variables cualitativas están correctamente codificadas. Sin embargo, en las continuas detectamos anomalías en TARHOGENTREV_HH y CUIDADOSHIJOS_HH.

summary(data_num)
     SEXO           EDAD                             TAMUNI   
 Hombre:2013   Min.   :16.00   >1000000 habitantes      :455  
 Mujer :1992   1st Qu.:37.00   400001-1000000 habitantes:353  
               Median :50.00   100001-400000 habitantes :993  
               Mean   :50.02   50001-100000 habitantes  :551  
               3rd Qu.:63.00   10001-50000 habitantes   :986  
               Max.   :97.00   2001-10000 habitantes    :477  
                               ≤2000 habitantes         :190  
          INGRESHOG   TARHOGENTREV_HH                   HIJOMENOR   
 Más de 5000€  :408   Min.   : 0.000   Tiene hijos/as menores:1067  
 3901-5000€    :595   1st Qu.: 1.000   Ninguno               :2930  
 2701-3900€    :891   Median : 2.000   NA's                  :   8  
 1801-2700€    :879   Mean   : 2.401                                
 1100-1800€    :716   3rd Qu.: 3.000                                
 Menos de 1100€:329   Max.   :24.000                                
 NA's          :187   NA's   :204                                   
                                     SITLAB                  NIVELESTENTREV
 Trabaja                                :2373   Licenciatura        : 634  
 Jubilado/a o pensionista (ha trabajado): 868   Bachillerato        : 585  
 En paro, ha trabajado antes            : 300   FP grado superior   : 517  
 Estudiante                             : 176   Educación secundaria: 492  
 Trabajo doméstico no remunerado        : 128   Máster oficial      : 374  
 (Other)                                : 155   (Other)             :1374  
 NA's                                   :   5   NA's                :  29  
               GRADACDISC            GRADODESIGUALDAD VALSALARIOS  VALPOSASC   
 Nada de acuerdo    :1303   Casi inexistentes: 542    Peor :2465   Peor :2360  
 Poco de acuerdo    :1102   Pequeñas         :1044    Igual:1323   Igual:1297  
 Regular            :  37   Bastante grandes :1681    Mejor: 139   Mejor: 267  
 Bastante de acuerdo: 778   Muy grandes      : 636    NA's :  78   NA's :  81  
 Muy de acuerdo     : 754   NA's             : 102                             
 NA's               :  31                                                      
                                                                               
  VALOPEMP      ESCFEMINIS        ESCIDEOL                          RELIGION   
 Peor :1851   Min.   : 0.000   Min.   : 1.00   Católico/a practicante   : 636  
 Igual:1731   1st Qu.: 5.000   1st Qu.: 3.00   Católico/a no practicante:1372  
 Mejor: 357   Median : 7.000   Median : 5.00   Creyente de otra religión: 134  
 NA's :  66   Mean   : 6.267   Mean   : 4.77   Agnóstico/a              : 592  
              3rd Qu.: 8.000   3rd Qu.: 7.00   Indiferente, no creyente : 519  
              Max.   :10.000   Max.   :10.00   Ateo/a                   : 692  
              NA's   :59       NA's   :218     NA's                     :  60  
 CUIDADOHIJOS_HH                                 RECUVOTOG  
 Min.   : 0.000   PSOE (PSC, PSE-EE, PSdeG, PSIB, PSN):988  
 1st Qu.: 2.000   PP                                  :854  
 Median : 4.000   SUMAR (Podemos, IU, Más País, etc.) :524  
 Mean   : 5.158   N.C.                                :338  
 3rd Qu.: 6.000   VOX                                 :265  
 Max.   :24.000   (Other)                             :371  
 NA's   :3003     NA's                                :665  
  • TARHOGENTREV_HH(horas dedicadas a tareas del hogar): presenta un valor máximo de 24, lo que implicaría dedicar todo el día a estas tareas, algo poco realista. Este valor se aleja mucho de la media (2,41), la mediana (2) y el tercer cuartil (3).
ggplot(data_num) +
  geom_bar(aes(x = TARHOGENTREV_HH), fill = '#17becf', alpha = 0.8 ) +
  labs(title = 'Distribución variable TARHOGENTREV_HH') +
  theme_minimal()
Warning: Removed 204 rows containing non-finite outside the scale range
(`stat_count()`).

El histograma muestra que la gran mayoría dedica entre 0 y 5 horas a tareas del hogar y valor máximo de 24h esta aislado y sin continuidad en la distribuciónEste dato es poco plausible, por lo que seguramente se trate de un error, asi que vamos a pasarlo a NA directamente.

data_num <- 
  data_num |> 
  mutate(TARHOGENTREV_HH = ifelse(TARHOGENTREV_HH == 24, NA, TARHOGENTREV_HH))
  • CUIDADOHIJOS_HH(horas dedicadas al cuidado de los hijos): también tiene un máximo de 24, pero en este caso es plausible, especialmente en familias con recién nacidos. No obstante, sigue siendo un valor extremo frente a la media (5,16), la mediana (4) y el tercer cuartil (6).
  ggplot(data_num) +
    geom_bar(aes(x = CUIDADOHIJOS_HH), fill = '#17becf', alpha = 0.8 ) +
    labs(title = 'Distribución variable CUIDADOSHIJOS_HH') +
    theme_minimal()
Warning: Removed 3003 rows containing non-finite outside the scale range
(`stat_count()`).

En este caso, los valores de 24 h podrían formar parte natural de la distribución, que muestra una clara cola derecha. A diferencia del caso anterior, no es un valor aislado, sino una respuesta que se repite. Por ello, no lo consideraremos un error y lo mantendremos, aunque lo tendremos en cuenta en futuros análisis.

Detección de outliers 🔍

Univariante

Aplicamos la función que nos calcula los valores atípicos y extremos.

source("Funcion_atipicos.R")

numeric_integer_vars <- names(which(sapply(data_num, is.numeric) | sapply(data_num, is.integer)))
# Aplicar la función 'outliers' a cada una de las variables numéricas
outliers_results <- lapply(numeric_integer_vars, function(var) {
  outliers(data_num, var)  # Llamar a la función pasando el nombre de la variable
})


📌 Outliers identified in EDAD : 0 outliers
📊 Proportion (%) of outliers: 0 %

🚨 Extreme values identified in EDAD : 0 extreme values
📊 Proportion (%) of extreme values: 0 %
Warning: Removed 210 rows containing non-finite outside the scale range
(`stat_bin()`).
Warning: Removed 210 rows containing non-finite outside the scale range
(`stat_boxplot()`).


📌 Outliers identified in TARHOGENTREV_HH : 109 outliers
📊 Proportion (%) of outliers: 2.87 %

🚨 Extreme values identified in TARHOGENTREV_HH : 34 extreme values
📊 Proportion (%) of extreme values: 0.9 %
Warning: Removed 59 rows containing non-finite outside the scale range
(`stat_bin()`).
Warning: Removed 59 rows containing non-finite outside the scale range
(`stat_boxplot()`).


📌 Outliers identified in ESCFEMINIS : 346 outliers
📊 Proportion (%) of outliers: 8.77 %

🚨 Extreme values identified in ESCFEMINIS : 0 extreme values
📊 Proportion (%) of extreme values: 0 %
Warning: Removed 218 rows containing non-finite outside the scale range
(`stat_bin()`).
Warning: Removed 218 rows containing non-finite outside the scale range
(`stat_boxplot()`).


📌 Outliers identified in ESCIDEOL : 0 outliers
📊 Proportion (%) of outliers: 0 %

🚨 Extreme values identified in ESCIDEOL : 0 extreme values
📊 Proportion (%) of extreme values: 0 %
Warning: Removed 3003 rows containing non-finite outside the scale range
(`stat_bin()`).
Warning: Removed 3003 rows containing non-finite outside the scale range
(`stat_boxplot()`).


📌 Outliers identified in CUIDADOHIJOS_HH : 67 outliers
📊 Proportion (%) of outliers: 6.69 %

🚨 Extreme values identified in CUIDADOHIJOS_HH : 35 extreme values
📊 Proportion (%) of extreme values: 3.49 %

⬇️⬇️⬇️

  • Mirando los boxplots, observamos que las variables TARHOGENTREV_HH, ESCFEMINIS y CUIDADOHIJOS_HH presentan datos que podrían considerarse atípicos. Sin embargo, antes de clasificarlos directamente como tales, es importante analizar si realmente lo son.

  • Para ello, comenzaremos revisando los histogramas de cada variable, ya que es posible que esos valores simplemente formen parte de una distribución asimétrica y no correspondan necesariamente a anomalías. Además, analizaremos los porcentajes de casos que representan esos valores “atípicos” dentro de la base de datos, para valorar si, por su peso relativo, pueden considerarse datos típicos del conjunto. Vamos a mirarlo variable por variable.

  • No obstante, corroboraremos nuestras hipótesis del univariante al hacer el análisis multivariante y ya tomar la decisión de que hacer con ellos.

📌 Outliers identified in TARHOGENTREV_HH : 115 outliers 📊 Proportion (%) of outliers: 3.03 %

🚨 Extreme values identified in TARHOGENTREV_HH : 40 extreme values 📊 Proportion (%) of extreme values: 1.05 %

  • Vamos a cuantificarlos
#outliers
outlier_values_th <- boxplot.stats(data_num$TARHOGENTREV_HH)$out 
outlier_values_th
  [1]  8  8  8 12  7 12  7  7  7  7  8  7  7 10 10  7  8 10 10  8 15  7 10 12  7
 [26] 10  7  8  8  8  8 12 10  8 10  9 10  7  8 10 12  8  9  8  7  8  7  8  8 10
 [51]  8  7  8 12  7  8  8  7  8  9  7  8  7 18  7  8  8  7  7  8  7  8  8  7 10
 [76] 14  8  7  7 10  7  9  8  8 10  8 10  7 10 12  8  7  7 16 10  8 12  8  8 10
[101]  8  8 11 11  7 10  8 10  8
out_ind_th <- which(data_num$TARHOGENTREV_HH %in% c(outlier_values_th))
out_ind_th
  [1]   28  156  213  250  269  292  295  312  315  331  349  383  398  431  438
 [16]  451  509  513  525  778  876  926  962  963  996  997 1003 1050 1104 1113
 [31] 1120 1133 1148 1187 1191 1194 1234 1262 1264 1306 1359 1536 1641 1676 1682
 [46] 1688 1719 1736 1774 1814 1839 1848 1891 1928 1937 1986 1987 2017 2038 2109
 [61] 2158 2203 2235 2287 2313 2323 2341 2348 2359 2366 2480 2559 2710 2724 2731
 [76] 2736 2748 2752 2766 2944 2972 3027 3039 3078 3098 3103 3124 3146 3181 3292
 [91] 3308 3403 3517 3518 3579 3609 3630 3674 3687 3704 3780 3845 3857 3878 3883
[106] 3890 3982 4000 4002
#extremos
extreme_values_th <- boxplot.stats(data_num$TARHOGENTREV_HH,coef=3)$out
extreme_values_th
 [1] 12 12 10 10 10 10 15 10 12 10 12 10 10 10 10 12 10 12 18 10 14 10 10 10 10
[26] 12 16 10 12 10 11 11 10 10
ext_ind_th <- which(data_num$TARHOGENTREV_HH %in% c(extreme_values_th))
ext_ind_th
 [1]  250  292  431  438  513  525  876  962  963  997 1133 1148 1191 1234 1306
[16] 1359 1814 1928 2287 2731 2736 2944 3098 3124 3181 3292 3518 3579 3630 3704
[31] 3857 3878 3890 4000
  • El porcentaje de atípicos es del 3,03% y de extremos del 1,05%, lo cual entra dentro del rango que suele considerarse aceptable (entre un 2% y un 5%), aunque no conviene aplicar esta regla de forma automática. Si miramos el histograma, vemos que los outliers están entre 7 y 10 horas, mientras que los extremos van de 10 a 18 horas. Teniendo en cuenta que la variable mide el número de horas dedicadas al hogar, a partir de unas 12 horas ya podríamos decir que es bastante inusual.

  • En el histograma se nota claramente que los extremos están muy lejos del resto de los datos, lo que hace pensar que sería buena idea apartarlos o quitarlos del análisis. En cambio, los outliers, aunque altos, parecen formar parte de la cola natural de la distribución y probablemente reflejen simplemente que algunas personas dedican mucho más tiempo al hogar. Además, siendo un 3,03% frente al 1,05% de los extremos, parece razonable quedarse con los outliers, ya que dedicar entre 7 y 10 horas puede ser mucho, pero no algo súper exagerado.

  • No obstante, tendremos esto en cuenta pero tomaremos la decisión final en el análisis bivariante. Si no encontramos asociación con ninguna variable, al ser el porcentaje relativamente bajo, nos desprenderemos de ellos.

📌 Outliers identified in ESCFEMINIS : 346 outliers 📊 Proportion (%) of outliers: 8.77 %

🚨 Extreme values identified in ESCFEMINIS : 0 extreme values 📊 Proportion (%) of extreme values: 0 %

  • Vamos a cuantificarlos
#outliers
outlier_values_f <- boxplot.stats(data_num$ESCFEMINIS)$out 
outlier_values_f
  [1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 [38] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 [75] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[112] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[149] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[186] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[223] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[260] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[297] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[334] 0 0 0 0 0 0 0 0 0 0 0 0 0
out_ind_f <- which(data_num$ESCFEMINIS %in% c(outlier_values_f))
out_ind_f
  [1]   10   15   23   25   32   39   44   62   74   92   93  100  116  133  159
 [16]  163  183  192  198  202  214  216  225  234  239  242  246  262  266  275
 [31]  287  290  291  294  321  325  333  351  360  364  365  380  392  393  395
 [46]  397  423  427  440  445  450  451  469  479  497  503  525  535  541  543
 [61]  545  551  564  571  577  578  588  601  630  658  664  670  702  707  710
 [76]  713  720  723  733  763  766  784  795  799  801  813  823  826  845  866
 [91]  901  922  935  951  956  973  984 1017 1018 1020 1027 1030 1039 1062 1085
[106] 1094 1101 1114 1120 1138 1145 1149 1156 1162 1167 1170 1171 1175 1192 1199
[121] 1207 1208 1211 1224 1227 1230 1231 1246 1271 1272 1278 1279 1288 1298 1307
[136] 1309 1311 1316 1322 1323 1326 1340 1343 1354 1362 1390 1399 1403 1405 1409
[151] 1439 1442 1449 1462 1468 1487 1488 1505 1507 1516 1532 1540 1590 1591 1603
[166] 1631 1640 1642 1665 1690 1694 1695 1700 1706 1719 1750 1762 1832 1849 1861
[181] 1864 1881 1885 1886 1887 1888 1890 1936 1982 1984 2011 2029 2054 2055 2070
[196] 2085 2109 2113 2115 2116 2167 2194 2203 2206 2212 2222 2226 2227 2233 2248
[211] 2274 2281 2295 2296 2303 2307 2319 2320 2329 2330 2338 2349 2357 2361 2370
[226] 2371 2389 2411 2415 2426 2431 2445 2453 2455 2463 2464 2465 2467 2472 2475
[241] 2485 2509 2543 2550 2551 2574 2577 2584 2590 2595 2596 2599 2610 2633 2643
[256] 2644 2657 2660 2677 2694 2696 2698 2734 2772 2786 2792 2801 2809 2829 2865
[271] 2869 2870 2883 2907 2918 2944 2947 2957 2986 2995 3006 3030 3032 3037 3069
[286] 3073 3076 3086 3099 3102 3115 3123 3126 3136 3181 3185 3203 3215 3222 3224
[301] 3230 3232 3238 3241 3271 3300 3305 3306 3310 3323 3350 3351 3353 3379 3384
[316] 3385 3386 3418 3419 3431 3459 3466 3499 3502 3559 3575 3579 3594 3611 3629
[331] 3630 3641 3644 3647 3654 3661 3662 3676 3703 3725 3729 3851 3852 3853 3913
[346] 3915
#extremos
extreme_values_f <- boxplot.stats(data_num$ESCFEMINIS,coef=3)$out
extreme_values_f
numeric(0)
ext_ind_f <- which(data_num$ESCFEMINIS %in% c(extreme_values_f))
ext_ind_f
integer(0)
  • En esta variable no encontramos valores extremos, aunque sí aparece un porcentaje relativamente alto de outliers, con un 8,77%. La variable mide en una escala del 0 al 10 el nivel de feminismo percibido, donde 0 es “nada feminista” y 10 es “muy feminista”, preguntando a las personas dónde se ubican. Vemos que todos los outliers se concentran en el valor 0, lo cual es bastante interesante porque probablemente esté relacionado con alguna otra variable, ya que si miramos el histograma, la barra del 0 es igual de alta que muchas otras y no destaca visualmente como algo raro.

  • Viendo el alto porcentaje y que todos corresponden al cero, parece haber una asociación y no vamos a tener que quitarlos, en el bivariante veremos.

📌 Outliers identified in CUIDADOHIJOS_HH : 67 outliers 📊 Proportion (%) of outliers: 6.69 %

🚨 Extreme values identified in CUIDADOHIJOS_HH : 35 extreme values 📊 Proportion (%) of extreme values: 3.49 %

  • Vamos a cuantificarlos
#outliers
outlier_values_ch <- boxplot.stats(data_num$CUIDADOHIJOS_HH)$out 
outlier_values_ch
 [1] 24 24 16 24 16 24 24 13 19 21 24 18 16 24 16 24 24 24 20 24 24 18 24 16 15
[26] 24 18 24 24 16 24 24 14 24 24 24 14 17 16 16 24 18 24 18 24 18 20 24 16 14
[51] 14 24 14 15 16 18 24 16 18 24 13 24 18 24 24 16 16
out_ind_ch <- which(data_num$CUIDADOHIJOS_HH %in% c(outlier_values_ch))
out_ind_ch
 [1]   27  260  322  360  501  510  562  622  876  926  942  953  961  997 1186
[16] 1211 1246 1262 1266 1308 1313 1411 1489 1502 1536 1572 1760 1769 1774 1964
[31] 2020 2023 2141 2156 2223 2289 2630 2683 2716 2729 2760 2766 2809 2862 2907
[46] 2969 2978 3000 3103 3116 3185 3187 3275 3276 3433 3448 3457 3532 3538 3591
[61] 3620 3659 3684 3711 3798 3841 3973
#extremos
extreme_values_ch <- boxplot.stats(data_num$CUIDADOHIJOS_HH,coef=3)$out
extreme_values_ch
 [1] 24 24 24 24 24 19 21 24 24 24 24 24 20 24 24 24 24 24 24 24 24 24 24 24 24
[26] 24 24 20 24 24 24 24 24 24 24
ext_ind_ch <- which(data_num$CUIDADOHIJOS_HH %in% c(extreme_values_ch))
ext_ind_ch
 [1]   27  260  360  510  562  876  926  942  997 1211 1246 1262 1266 1308 1313
[16] 1489 1572 1769 1774 2020 2023 2156 2223 2289 2760 2809 2907 2978 3000 3187
[31] 3457 3591 3659 3711 3798
  • En esta variable tenemos un 6,69% de outliers y un 3,49% de extremos, lo que ya empieza a salirse un poco del rango típico del 2-5%. La variable mide el número de horas dedicadas al cuidado de los hijos en el hogar, y cuando miramos los datos vemos valores altos como 13, 16, 20 y hasta 24 horas. Si pensamos en hogares con recién nacidos o bebés, tiene todo el sentido que se reporten valores tan elevados, porque básicamente alguien está pendiente de ellos casi las 24 horas del día.

  • Además, estos valores parecen formar parte de una distribución asimétrica, donde la cola se alarga hacia la derecha con esas horas tan altas. Por eso, nosotros de momento no los quitaríamos, ya que reflejan una situación real y relevante, aunque lo ideal será mirarlo más a fondo en el análisis bivariante para ver si realmente tienen un impacto importante o si están relacionados con otras variables.

Bivariante

En esta parte vamos a ir gráfico por gráfico para ver si los posibles outliers que detectamos antes forman parte de alguna asociación entre variables. La idea es ver si esos valores extremos tienen sentido dentro de un patrón más amplio o si realmente se salen por completo y hay que quitarlos.

Warning

Vamos a hacer los gráficos solo para cualitativas porque para cuaanti vs cuanti salen muy mal ya que las variables son cuantitativas discretas. Un ejemplo de lo que comentamos:

ggplot(data_num,aes(CUIDADOHIJOS_HH, TARHOGENTREV_HH)) + 
  geom_point() +
  stat_smooth(method = "lm",formula = y ~ x,geom = "smooth")
Warning: Removed 3021 rows containing non-finite outside the scale range
(`stat_smooth()`).
Warning: Removed 3021 rows containing missing values or values outside the scale range
(`geom_point()`).

No hay por donde cogerlo.

ggplot(data_num, aes(x = SEXO, y = TARHOGENTREV_HH)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 210 rows containing non-finite outside the scale range
(`stat_boxplot()`).

ggplot(data_num, aes(x = TAMUNI, y = TARHOGENTREV_HH)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 210 rows containing non-finite outside the scale range
(`stat_boxplot()`).

ggplot(data_num, aes(x = INGRESHOG, y = TARHOGENTREV_HH)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 210 rows containing non-finite outside the scale range
(`stat_boxplot()`).

ggplot(data_num, aes(x = SITLAB, y = TARHOGENTREV_HH)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 210 rows containing non-finite outside the scale range
(`stat_boxplot()`).

ggplot(data_num, aes(x = GRADACDISC, y = TARHOGENTREV_HH)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 210 rows containing non-finite outside the scale range
(`stat_boxplot()`).

ggplot(data_num, aes(x = GRADODESIGUALDAD, y = TARHOGENTREV_HH)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 210 rows containing non-finite outside the scale range
(`stat_boxplot()`).

Los valores extremos de la variable TARHOGENTREV_HH no pueden explicarse claramente mediante ninguna de las variables categóricas analizadas. Aparecen de forma dispersa en todos los grupos, aunque algunas variables como situación laboral o percepción de desigualdad muestran ligeras asociaciones, pero no suficientes para justificar los valores atípicos más altos.

  • Hemos decidido tratar los valores extremos de la variable TARHOGENTREV_HH para que no distorsionen los análisis. En total detectamos 115 outliers, pero solo 40 eran realmente extremos, porque estaban muy por encima de lo normal (más allá de Q3 + 3·IQR). En lugar de eliminarlos todos o inventar valores, lo que hicimos fue reemplazar solo esos 40 casos por NA. DEJAMOS OUTLIERS Y QUITAMOS EXTREMOS.
Note
  • Los vamos a quitar después del LOF ya que si los pasamos a na antes, el lof quita los na y no nos selecciona los datos puros.

Observar donde exactamente están nuestros outliers nos sirve para ver estas relaciones más claras.

data_num[out_ind_th, ]
# A tibble: 109 × 18
   SEXO    EDAD TAMUNI INGRESHOG TARHOGENTREV_HH HIJOMENOR SITLAB NIVELESTENTREV
   <fct>  <dbl> <ord>  <ord>               <dbl> <fct>     <fct>  <fct>         
 1 Mujer     60 50001… 1100-180…               8 Ninguno   En pa… Primaria      
 2 Hombre    58 10000… 3901-500…               8 Ninguno   Traba… Doctorado     
 3 Mujer     36 10000… 1100-180…               8 Tiene hi… Traba… Grado univers…
 4 Hombre    83 2001-… <NA>                   12 Ninguno   Jubil… Arquitectura/…
 5 Hombre    70 10001… 1801-270…               7 Ninguno   Jubil… FP grado supe…
 6 Mujer     70 10001… Menos de…              12 Ninguno   Traba… <NA>          
 7 Mujer     42 10001… 1100-180…               7 Tiene hi… Traba… FP grado medio
 8 Hombre    46 10000… 2701-390…               7 Ninguno   Traba… Bachillerato  
 9 Mujer     69 10000… <NA>                    7 Ninguno   Jubil… Diplomaturas …
10 Hombre    58 10001… 1100-180…               7 Ninguno   En pa… Educación sec…
# ℹ 99 more rows
# ℹ 10 more variables: GRADACDISC <ord>, GRADODESIGUALDAD <ord>,
#   VALSALARIOS <ord>, VALPOSASC <ord>, VALOPEMP <ord>, ESCFEMINIS <dbl>,
#   ESCIDEOL <dbl>, RELIGION <fct>, CUIDADOHIJOS_HH <dbl>, RECUVOTOG <fct>
data_num[ext_ind_th, ]
# A tibble: 34 × 18
   SEXO    EDAD TAMUNI INGRESHOG TARHOGENTREV_HH HIJOMENOR SITLAB NIVELESTENTREV
   <fct>  <dbl> <ord>  <ord>               <dbl> <fct>     <fct>  <fct>         
 1 Hombre    83 2001-… <NA>                   12 Ninguno   Jubil… Arquitectura/…
 2 Mujer     70 10001… Menos de…              12 Ninguno   Traba… <NA>          
 3 Mujer     45 40000… 1801-270…              10 Tiene hi… Traba… Diplomaturas …
 4 Mujer     51 10000… 1100-180…              10 Tiene hi… En pa… Grado univers…
 5 Mujer     71 10001… <NA>                   10 Ninguno   Traba… Educación sec…
 6 Mujer     55 10001… 1801-270…              10 Ninguno   Traba… Educación sec…
 7 Mujer     37 50001… 2701-390…              15 Tiene hi… Traba… Diplomaturas …
 8 Hombre    77 10001… 1801-270…              10 Ninguno   Jubil… Educación sec…
 9 Mujer     32 10001… 1100-180…              12 Tiene hi… En pa… Licenciatura  
10 Mujer     22 10000… 1100-180…              10 Tiene hi… Traba… Bachillerato  
# ℹ 24 more rows
# ℹ 10 more variables: GRADACDISC <ord>, GRADODESIGUALDAD <ord>,
#   VALSALARIOS <ord>, VALPOSASC <ord>, VALOPEMP <ord>, ESCFEMINIS <dbl>,
#   ESCIDEOL <dbl>, RELIGION <fct>, CUIDADOHIJOS_HH <dbl>, RECUVOTOG <fct>
ggplot(data_num, aes(x = SEXO, y = ESCFEMINIS)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 59 rows containing non-finite outside the scale range
(`stat_boxplot()`).

ggplot(data_num, aes(x = GRADACDISC, y = ESCFEMINIS)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 59 rows containing non-finite outside the scale range
(`stat_boxplot()`).

ggplot(data_num, aes(x = GRADODESIGUALDAD, y = ESCFEMINIS)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 59 rows containing non-finite outside the scale range
(`stat_boxplot()`).

ggplot(data_num, aes(x = VALSALARIOS, y = ESCFEMINIS)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 59 rows containing non-finite outside the scale range
(`stat_boxplot()`).

ggplot(data_num, aes(x = VALPOSASC, y = ESCFEMINIS)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 59 rows containing non-finite outside the scale range
(`stat_boxplot()`).

ggplot(data_num, aes(x = VALOPEMP, y = ESCFEMINIS)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 59 rows containing non-finite outside the scale range
(`stat_boxplot()`).

ggplot(data_num, aes(x = RECUVOTOG, y = ESCFEMINIS)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 59 rows containing non-finite outside the scale range
(`stat_boxplot()`).

Los valores atípicos de 0 en la variable ESCFEMINIS (escala de autodefinición feminista) no parecen ser errores de codificación, sino respuestas intencionadas y coherentes por parte de ciertos perfiles ideológicos. Al analizar su asociación con otras variables, observamos patrones claros que eran los que ya veniamos intuyendo en nuestras hipótesis iniciales.

  • RECUVOTOG (recuerdo de voto): La gran mayoría de estos valores extremos se concentran entre personas que afirman haber votado a VOX, un partido que habitualmente se posiciona de forma crítica frente al feminismo.

  • GRADODESIGUALDAD (grado de desigualdad percibida): Los valores bajos en ESCFEMINIS suelen darse entre quienes creen que las desigualdades de género en España son pequeñas o casi inexistentes. Esto tiene sentido, ya que si no se percibe desigualdad, es menos probable que una persona se autodefina como feminista.

  • GRADACDISC (grado de acuerdo con la afirmación de que se discrimina a los hombres): Aquí también se ve una relación esperada: quienes más de acuerdo están con esta afirmación tienden a tener puntuaciones más bajas en la escala feminista.

  • VALSALARIOS, VALPOSASC y VALOPEMP (valoraciones sobre si las mujeres están en peor situación en salarios, ascensos y empleo): Los valores de ESCFEMINIS más bajos se asocian con quienes creen que la situación de mujeres y hombres es igual o incluso mejor para ellas. Esto también es lógico: si se percibe que no existe desventaja, es menos probable que se adopte una postura feminista.

  • SEXO: Aunque hay algún valor 0 tanto en hombres como mujeres, son mucho más frecuentes entre hombres.

Important

Por tanto, no los eliminamos, nos los quedamos, porque sino estaríamos eliminando algo clave que nos ayuda a rebatir el objetivo que tenemos de desmentir la afirmación que sale en El País. Además el porentaje era bastante elevado

Observar donde exactamente están nuestros outliers nos sirve para ver estas relaciones más claras.

data_num[out_ind_f, ]
# A tibble: 346 × 18
   SEXO    EDAD TAMUNI INGRESHOG TARHOGENTREV_HH HIJOMENOR SITLAB NIVELESTENTREV
   <fct>  <dbl> <ord>  <ord>               <dbl> <fct>     <fct>  <fct>         
 1 Hombre    60 10000… 2701-390…               1 Ninguno   Traba… Doctorado     
 2 Hombre    21 10001… <NA>                    5 Ninguno   En pa… FP grado medio
 3 Mujer     58 10000… 1801-270…               0 Ninguno   Traba… Bachillerato  
 4 Hombre    85 10000… 2701-390…               0 Ninguno   Jubil… Licenciatura  
 5 Mujer     50 2001-… 1801-270…               6 Tiene hi… Traba… Educación sec…
 6 Mujer     39 10000… 2701-390…               1 Tiene hi… Traba… FP grado medio
 7 Hombre    44 10001… 3901-500…               2 Ninguno   Traba… FP grado supe…
 8 Hombre    67 10000… 1100-180…              NA Ninguno   Jubil… Licenciatura  
 9 Hombre    65 10000… 2701-390…               3 Ninguno   Traba… FP grado supe…
10 Hombre    54 50001… 2701-390…               0 Ninguno   Traba… FP grado medio
# ℹ 336 more rows
# ℹ 10 more variables: GRADACDISC <ord>, GRADODESIGUALDAD <ord>,
#   VALSALARIOS <ord>, VALPOSASC <ord>, VALOPEMP <ord>, ESCFEMINIS <dbl>,
#   ESCIDEOL <dbl>, RELIGION <fct>, CUIDADOHIJOS_HH <dbl>, RECUVOTOG <fct>
#no hay
data_num[ext_ind_f, ]
# A tibble: 0 × 18
# ℹ 18 variables: SEXO <fct>, EDAD <dbl>, TAMUNI <ord>, INGRESHOG <ord>,
#   TARHOGENTREV_HH <dbl>, HIJOMENOR <fct>, SITLAB <fct>, NIVELESTENTREV <fct>,
#   GRADACDISC <ord>, GRADODESIGUALDAD <ord>, VALSALARIOS <ord>,
#   VALPOSASC <ord>, VALOPEMP <ord>, ESCFEMINIS <dbl>, ESCIDEOL <dbl>,
#   RELIGION <fct>, CUIDADOHIJOS_HH <dbl>, RECUVOTOG <fct>
ggplot(data_num, aes(x = SEXO, y = CUIDADOHIJOS_HH)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 3003 rows containing non-finite outside the scale range
(`stat_boxplot()`).

ggplot(data_num, aes(x = SITLAB, y = CUIDADOHIJOS_HH)) +
  geom_boxplot() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
Warning: Removed 3003 rows containing non-finite outside the scale range
(`stat_boxplot()`).

Al mirar la variable CUIDADOHIJOS_HH comparada con el resto, vemos que en la mayoría de los casos no parece haber una relación clara. Pero cuando la comparamos con la situación laboral (SITLAB), sí que aparece una cierta asociación. Esto nos hace pensar que esa variable forma parte del comportamiento general de los datos, y por tanto, podríamos estar ante una distribución asimétrica.

  • Por eso, de momento no la vamos a eliminar, aunque más adelante, cuando hagamos el análisis con el método LOF, podría que nos indique que sí deberíamos quitarla si se comporta como un valor atípico.

Observar donde exactamente están nuestros outliers nos sirve para ver estas relaciones más claras.

data_num[out_ind_ch, ]
# A tibble: 67 × 18
   SEXO    EDAD TAMUNI INGRESHOG TARHOGENTREV_HH HIJOMENOR SITLAB NIVELESTENTREV
   <fct>  <dbl> <ord>  <ord>               <dbl> <fct>     <fct>  <fct>         
 1 Mujer     28 10001… Menos de…               3 Tiene hi… En pa… Educación sec…
 2 Mujer     33 ≤2000… 2701-390…               2 Tiene hi… Traba… Grado univers…
 3 Mujer     31 10001… 1100-180…               3 Tiene hi… En pa… Máster oficial
 4 Mujer     28 2001-… <NA>                    2 Tiene hi… En pa… Primaria      
 5 Mujer     32 2001-… 2701-390…               2 Tiene hi… Traba… Máster oficial
 6 Hombre    41 10001… 1100-180…               3 Tiene hi… Traba… FP grado medio
 7 Mujer     51 40000… 1100-180…               2 Tiene hi… Traba… Títulos propi…
 8 Mujer     44 2001-… 2701-390…               2 Tiene hi… Traba… FP grado supe…
 9 Mujer     37 50001… 2701-390…              15 Tiene hi… Traba… Diplomaturas …
10 Mujer     29 40000… 2701-390…               7 Tiene hi… Traba… Licenciatura  
# ℹ 57 more rows
# ℹ 10 more variables: GRADACDISC <ord>, GRADODESIGUALDAD <ord>,
#   VALSALARIOS <ord>, VALPOSASC <ord>, VALOPEMP <ord>, ESCFEMINIS <dbl>,
#   ESCIDEOL <dbl>, RELIGION <fct>, CUIDADOHIJOS_HH <dbl>, RECUVOTOG <fct>
data_num[ext_ind_ch, ]
# A tibble: 35 × 18
   SEXO    EDAD TAMUNI INGRESHOG TARHOGENTREV_HH HIJOMENOR SITLAB NIVELESTENTREV
   <fct>  <dbl> <ord>  <ord>               <dbl> <fct>     <fct>  <fct>         
 1 Mujer     28 10001… Menos de…               3 Tiene hi… En pa… Educación sec…
 2 Mujer     33 ≤2000… 2701-390…               2 Tiene hi… Traba… Grado univers…
 3 Mujer     28 2001-… <NA>                    2 Tiene hi… En pa… Primaria      
 4 Hombre    41 10001… 1100-180…               3 Tiene hi… Traba… FP grado medio
 5 Mujer     51 40000… 1100-180…               2 Tiene hi… Traba… Títulos propi…
 6 Mujer     37 50001… 2701-390…              15 Tiene hi… Traba… Diplomaturas …
 7 Mujer     29 40000… 2701-390…               7 Tiene hi… Traba… Licenciatura  
 8 Mujer     30 10001… 1100-180…               4 Tiene hi… Traba… FP grado medio
 9 Mujer     22 10000… 1100-180…              10 Tiene hi… Traba… Bachillerato  
10 Mujer     40 2001-… 1100-180…               4 Tiene hi… Traba… Educación sec…
# ℹ 25 more rows
# ℹ 10 more variables: GRADACDISC <ord>, GRADODESIGUALDAD <ord>,
#   VALSALARIOS <ord>, VALPOSASC <ord>, VALOPEMP <ord>, ESCFEMINIS <dbl>,
#   ESCIDEOL <dbl>, RELIGION <fct>, CUIDADOHIJOS_HH <dbl>, RECUVOTOG <fct>

Detección y tratamiento Multivariante (LOF) ⚙️

LOF es un algoritmo de detección de valores atípicos basado en la proximidad y la densidad.

LOF se centra en encontrar observaciones que se desvíen del patrón de densidad local. Es decir, modela los valores atípicos como puntos que están aislados de los datos restantes. En la práctica, la densidad local se obtiene de los k vecinos más cercanos.

Warning
  • Cuidado, este algoritmo detecta “Observaciones atípicas”(filas enteras) no “datos atípicos”(Datos sueltos individuales) considerando múltiples variables al mismo tiempo.

  • Es independiente a lo que acabamos de hacer pero nos puede ayudar a corregir previos fallos por ejemplo si no hemos detectado unos ouliers, alomejor el algoritmo nos recalca que están haciendo raras sus observaciones.

  • No podemos aplicar el LOF con NA’s, vemos los nas que tenemos.
#paquete skimr
data_num |> skim()
Data summary
Name data_num
Number of rows 4005
Number of columns 18
_______________________
Column type frequency:
factor 13
numeric 5
________________________
Group variables None

Variable type: factor

skim_variable n_missing complete_rate ordered n_unique top_counts
SEXO 0 1.00 FALSE 2 Hom: 2013, Muj: 1992
TAMUNI 0 1.00 TRUE 7 100: 993, 100: 986, 500: 551, 200: 477
INGRESHOG 187 0.95 TRUE 6 270: 891, 180: 879, 110: 716, 390: 595
HIJOMENOR 8 1.00 FALSE 2 Nin: 2930, Tie: 1067
SITLAB 5 1.00 FALSE 8 Tra: 2373, Jub: 868, En : 300, Est: 176
NIVELESTENTREV 29 0.99 FALSE 16 Lic: 634, Bac: 585, FP : 517, Edu: 492
GRADACDISC 31 0.99 TRUE 5 Nad: 1303, Poc: 1102, Bas: 778, Muy: 754
GRADODESIGUALDAD 102 0.97 TRUE 4 Bas: 1681, Peq: 1044, Muy: 636, Cas: 542
VALSALARIOS 78 0.98 TRUE 3 Peo: 2465, Igu: 1323, Mej: 139
VALPOSASC 81 0.98 TRUE 3 Peo: 2360, Igu: 1297, Mej: 267
VALOPEMP 66 0.98 TRUE 3 Peo: 1851, Igu: 1731, Mej: 357
RELIGION 60 0.99 FALSE 6 Cat: 1372, Ate: 692, Cat: 636, Agn: 592
RECUVOTOG 665 0.83 FALSE 16 PSO: 988, PP: 854, SUM: 524, N.C: 338

Variable type: numeric

skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist
EDAD 0 1.00 50.02 17.31 16 37 50 63 97 ▅▇▇▅▁
TARHOGENTREV_HH 210 0.95 2.37 1.81 0 1 2 3 18 ▇▂▁▁▁
ESCFEMINIS 59 0.99 6.27 2.74 0 5 7 8 10 ▂▁▆▇▅
ESCIDEOL 218 0.95 4.77 2.52 1 3 5 7 10 ▆▇▇▅▂
CUIDADOHIJOS_HH 3003 0.25 5.16 4.95 0 2 4 6 24 ▇▅▁▁▁
  • Vemos que la variable de hijos tiene 3003 nas, no podemos quitarnosla y continuar porque nos quitamos un muy alto porcentaje de la base de datos. Vamos a realizar 2 análisis LOF, uno quitando esa variable y otro incluyendola.

LOF SIN HIJOS

  • Filtramos las variables y quitamos los nas.
data_num_sin <- 
  data_num |> 
  select(EDAD, TARHOGENTREV_HH, ESCFEMINIS, ESCIDEOL) |> 
  drop_na()
k <- round(log(nrow(data_num_sin)))
lof_resultados <- lof(data_num_sin, minPts = k) 

lof_resultados
   [1] 1.4599376 0.9738251 1.1576113 1.0621084 1.0256065 1.2018108 1.1112420
   [8] 1.2253331 1.1401325 0.9975768 1.0014072 1.1207934 1.0864148 1.1675244
  [15] 0.9982984 1.5023803 1.0232819 1.0503087 0.9508987 0.9940573 1.1443055
  [22] 1.9570968 1.1260508 1.3277365 1.1426887 1.0209217 1.3158675 0.9996222
  [29] 0.9908761 0.9985809 1.0684519 0.9859044 1.0669082 1.0020983 0.9744729
  [36] 1.1714150 0.9803912 1.1813655 1.4453933 0.9765826 0.9926022 1.1847770
  [43] 1.0130998 0.9437080 1.0615287 1.0050037 0.9918519 1.0901513 1.2138134
  [50] 1.0785147 1.1776148 0.9952440 1.1375587 0.9764821 1.0265309 0.9981073
  [57] 1.0508548 1.0724802 1.0467342 1.3267282 0.9461872 1.0773164 1.0345129
  [64] 1.0724242 1.0474636 0.9953121 0.9883588 0.9768542 1.0710979 1.0339053
  [71] 0.9536089 1.0784869 0.9542357 1.1432652 0.9904785 1.0137818 1.0012954
  [78] 1.0908904 0.9743713 1.0134172 1.0712019 1.1993067 0.9927525 0.9570438
  [85] 0.9770652 0.9921368 1.0797035 1.3573995 1.2701738 1.0606940 1.1592909
  [92] 1.0123523 1.1613117 1.0622820 1.1706026 1.0385454 0.9839818 0.9840780
  [99] 1.0996738 1.0882841 1.1837036 1.0570409 1.1860549 0.9735926 1.0236808
 [106] 1.2976583 1.1447240 1.1389255 0.9970834 1.0650561 1.1756883 1.1980336
 [113] 0.9755443 1.3470713 1.1469384 1.0083591 1.0499042 0.9487408 1.1696200
 [120] 1.0604570 1.1562398 1.0254812 0.9376891 1.1604851 1.0733445 1.5118062
 [127] 1.0940628 1.0129595 1.1491162 0.9409894 0.9967745 0.9989995 0.9335595
 [134] 0.9777411 1.0593012 1.0314933 1.2747142 0.9708341 1.2573628 1.1552956
 [141] 1.0679695 1.1059817 0.9808226 1.1331934 0.9612471 0.9654577 1.0197353
 [148] 1.0521085 0.9997308 1.2947236 1.0206716 0.9845474 0.9917670 0.9856867
 [155] 1.0078577 0.9996293 1.1323635 1.2973693 1.2060471 1.0795570 1.0602916
 [162] 1.2416063 1.0357066 1.0580238 1.0912767 1.0399273 0.9907887 1.0379950
 [169] 1.1072469 0.9576524 1.0130200 1.0139287 1.0830697 1.1541413 1.1908998
 [176] 1.1334393 1.1189983 1.0948709 1.1039096 0.9913232 1.1204934 1.0519142
 [183] 0.9660350 1.0278321 1.0265309 1.0547056 1.0117098 1.3055734 0.9982802
 [190] 0.9732963 1.5797111 1.0239573 0.9696920 1.0624277 0.9708832 0.9574712
 [197] 1.4534216 0.9884334 1.2859397 0.9683407 1.0255567 1.1712249 1.1369177
 [204] 0.9343691 0.9887773 0.9612486 1.2347004 0.9821490 0.9062357 1.1216055
 [211] 1.1699907 0.9533657 1.0243828 1.0220366 0.9600123 0.9895199 1.6464351
 [218] 0.9458680 1.0311507 1.2246676 0.9928039 1.0842464 1.0712726 0.9867177
 [225] 1.0221452 1.7389052 1.0773718 1.0434127 1.0832106 1.0650561 1.0134293
 [232] 1.2390299 1.2924124 1.2537873 1.0164706 1.1514345 0.9515526 1.1543370
 [239] 1.2410231 1.0852803 1.0056933 0.9979347 1.2106949 1.0458565 1.0447527
 [246] 0.9652077 1.0804635 1.2805791 1.6046556 1.0794866 1.1492391 1.0285922
 [253] 1.0611939 1.2309763 0.9949820 1.2449908 1.2309032 1.0020232 1.0037048
 [260] 0.9743645 1.1380701 1.0204389 1.5791852 1.1235205 0.9985085 0.9465930
 [267] 0.9768445 1.0230407 0.9997883 1.0064964 0.9822213 1.0464768 1.2625277
 [274] 1.0160334 1.0175410 1.1272761 1.0193109 1.0989194 1.0684239 0.9965436
 [281] 1.1258694 1.1936790 0.9874660 1.2014878 1.0505543 1.0722390 0.9891705
 [288] 1.0640689 1.1165825 1.1130043 0.9747209 0.9575718 0.9643923 1.2710178
 [295] 0.9539352 1.0863623 1.0062009 1.1346839 1.5708470 1.0078957 1.0722877
 [302] 1.2004153 1.3071426 0.9751292 0.9742030 0.9868255 1.0724242 1.7448698
 [309] 1.1701655 0.9450801 0.9614670 0.9924043 1.1381677 1.0559610 1.1641454
 [316] 0.9983694 1.4461401 1.0309448 0.9860054 1.0930070 1.0605979 0.9943844
 [323] 0.9766333 1.0143425 0.9986442 1.0540238 0.9652077 0.9931511 1.0570349
 [330] 1.0579598 1.0381585 1.3273265 1.0600816 1.0049500 1.1892952 0.9381896
 [337] 1.2088286 1.0885082 1.0070196 1.0080541 1.0112555 1.0197293 1.0876003
 [344] 1.0064171 1.4062580 1.0353053 1.0367644 0.9982090 1.2081309 0.9989237
 [351] 1.0224585 0.9969818 1.0985356 1.2033181 1.3189103 0.9819329 1.0196301
 [358] 1.3187700 1.0469241 1.0687483 1.0493582 0.9778170 1.2052630 1.0511184
 [365] 1.1098928 0.9959908 1.1034683 1.0406143 0.9768445 0.9764034 1.0732559
 [372] 1.1424533 1.1003237 1.0654744 0.9875582 1.0627890 1.0236733 0.9787529
 [379] 1.3827087 1.2863893 1.1498314 1.0620086 1.0261420 0.9688633 0.9629500
 [386] 1.0562486 1.1104943 1.1269857 0.9725664 1.0629895 1.0088762 0.9759672
 [393] 1.0770356 0.9875123 1.3329101 1.4598572 0.9852868 1.0107645 1.2671286
 [400] 1.2414705 0.9895629 1.0297860 0.9988416 1.0108205 1.0134354 1.3571933
 [407] 0.9637260 1.2964157 0.9776792 1.1305099 0.9542357 0.9895309 0.9857667
 [414] 1.0892735 1.0456199 0.9952081 0.9518782 1.1715637 1.0522989 0.9710577
 [421] 0.9751800 1.0767923 1.0474437 1.1587849 1.0372342 1.3683720 1.5120984
 [428] 1.1992880 1.0218664 1.0923574 1.2879635 1.1496739 1.3041501 1.0024124
 [435] 1.1870628 0.9584710 0.9871568 0.9974764 0.9907913 1.0140507 1.0537296
 [442] 1.0171132 1.0529281 1.5103945 0.9803882 1.0391853 1.0323204 0.9892577
 [449] 0.9802342 1.1929642 0.9893969 1.0597784 0.9746709 1.1877082 1.0106110
 [456] 0.9896986 0.9793354 1.2722128 1.0146606 1.0795570 1.0267636 0.9979147
 [463] 1.0100348 1.0323581 1.1403528 1.0285077 1.0109052 1.3213479 1.0866658
 [470] 0.9916110 1.1311769 1.0773476 1.2307768 1.0375704 1.1582983 1.0781427
 [477] 1.1361311 1.0105589 1.0252009 1.0861689 0.9939324 0.9545953 1.2411247
 [484] 1.0127368 1.2042960 1.2143530 1.0824883 1.1279562 1.1042289 1.1159134
 [491] 1.1462617 1.1039131 0.9621396 0.9999573 1.0396089 0.9910687 1.0645746
 [498] 1.0094248 1.0952004 0.9703882 1.0465803 0.9602044 1.0989086 1.0776763
 [505] 1.0108247 1.0106970 1.1083753 1.0454769 1.1256808 1.0162964 1.2853876
 [512] 1.0636858 1.0401515 1.1053756 1.0799793 1.0057624 1.0167954 0.9709480
 [519] 1.0958887 1.2494238 0.9890019 1.1654149 1.0587735 1.1405849 1.0332327
 [526] 1.0993058 1.1294025 1.0875272 1.0202281 1.1886446 0.9835073 1.4730080
 [533] 1.0992665 1.0374724 1.0722033 0.9650305 1.0567441 1.0349115 1.0074774
 [540] 1.1523949 1.1014912 0.9634120 1.0986395 1.0209217 1.1533773 0.9953717
 [547] 0.9997543 1.3465889 1.0047546 0.9985388 1.1512152 0.9955259 1.0662044
 [554] 1.0496558 1.1256167 1.0175631 1.1606454 1.0319704 1.0295019 1.0493818
 [561] 1.1183899 1.0012763 1.3738256 1.0041142 0.9228655 1.2906753 1.3542643
 [568] 1.2075289 0.9752461 1.0781913 1.1338576 1.0559514 1.4465208 1.0541595
 [575] 1.0684436 1.1181132 1.0313137 0.9903028 1.1323691 0.9368684 1.0379411
 [582] 1.2132212 0.9638149 1.1594863 1.0034847 0.9735864 1.1335798 1.1101869
 [589] 1.0034829 1.1316910 0.9730012 1.2255651 1.2117032 0.9312992 0.9508987
 [596] 1.0062452 0.9537620 1.1581435 0.9708341 1.0311401 1.4301155 1.1052389
 [603] 1.1040874 1.0138770 1.2433088 1.0209695 1.0714225 0.9943400 1.2188809
 [610] 1.0511497 1.0425750 1.0193176 0.9739214 1.0751893 0.9844830 1.2038099
 [617] 0.9615714 0.9825861 1.2092788 1.0837085 1.0800196 1.1019458 1.2480330
 [624] 1.1191550 1.0174198 0.9833115 0.9850707 1.1103693 1.1571887 1.1251497
 [631] 1.2924557 1.1651213 0.9319358 0.9517268 1.3822822 1.0004308 0.9929421
 [638] 0.9760973 0.9739019 0.9062357 0.9970254 0.9847539 1.0350672 1.0748454
 [645] 1.0165780 0.9979147 1.3614252 1.1266942 0.9755023 1.0527620 1.0216813
 [652] 0.9928291 0.9796603 0.9878251 1.0066268 1.4073943 1.0873034 1.1015785
 [659] 1.1131236 1.1316930 0.9730661 1.0068273 1.0173453 0.9416983 0.9657446
 [666] 0.9762993 1.0103018 0.9764237 1.0929394 1.1515757 1.0044544 1.0344383
 [673] 1.1400431 1.0412846 1.0913916 0.9922970 1.0286295 0.9860684 1.2070663
 [680] 1.3566059 1.2156861 0.9946854 1.0604269 1.0034028 0.9807376 0.9887228
 [687] 1.0975524 1.3589716 1.1871226 0.9884472 1.0902440 1.0001205 1.1114894
 [694] 1.2396987 1.0318072 1.1250619 1.0011803 1.0464843 1.1419854 1.0503172
 [701] 1.0206716 0.9525068 1.1142401 0.9381896 0.9508150 1.1379205 1.0117626
 [708] 1.2514110 1.0165972 1.1995701 1.1977676 0.9747182 1.0578969 0.9910601
 [715] 1.0778735 0.9768445 1.0836490 1.1006432 0.9943291 1.1709964 1.1327933
 [722] 0.9906803 1.0603252 1.0014445 1.0622244 0.9405865 1.0987718 0.9901412
 [729] 0.9854500 0.9652003 0.9942553 0.9368684 1.0045202 1.0780664 1.0975524
 [736] 1.0154460 1.2284668 1.0616774 1.0419527 0.9604546 0.9864898 1.0447355
 [743] 1.2462544 1.0877196 0.9842652 1.2850264 1.0733445 1.0544682 0.9926022
 [750] 1.0418632 0.9739018 1.1070313 1.1015571 1.0531971 1.0461643 0.9806636
 [757] 1.0816146 0.9887496 1.2567632 1.1011070 0.9629131 0.9917249 1.0182316
 [764] 1.4692098 1.1103026 1.0355387 1.3770391 0.9528481 1.0366854 1.1199986
 [771] 1.3028756 0.9880980 1.0394673 1.0108088 0.9652425 0.9409894 1.1717790
 [778] 1.0799461 1.7977047 1.3201652 1.0475757 0.9949820 1.2401699 0.9602647
 [785] 1.1084503 1.1104484 1.0803833 0.9690590 1.0015435 0.9959146 1.1515838
 [792] 1.3201642 0.9734662 1.0263222 1.0158263 0.9976307 0.9642013 1.2819826
 [799] 1.1850585 1.3589337 1.0680720 0.9877181 1.2166960 1.0416553 1.2450233
 [806] 1.0037656 1.0369613 1.1367403 1.0016340 1.2552597 0.9676791 0.9985774
 [813] 1.0194504 1.1365402 1.1034992 1.3621293 0.9896986 1.1306117 1.3660132
 [820] 1.0633089 1.0393903 1.0243704 1.1347856 1.0799044 1.1209894 0.9700555
 [827] 1.0679948 1.1334758 1.0657821 1.0375640 0.9778386 1.1244490 1.0950153
 [834] 0.9708341 0.9598749 1.1369102 1.0815843 1.3322764 1.0541002 1.0699560
 [841] 0.9354724 1.1347009 1.0010632 1.0537787 0.9434437 1.1837611 1.0270985
 [848] 1.1403224 1.0059109 1.2645761 1.0860026 0.9839835 0.9551123 1.0195973
 [855] 1.0720256 0.9876652 1.3959671 1.8914448 1.1097925 1.2951031 0.9871628
 [862] 1.2020828 0.9940719 1.1574969 1.0528539 1.2286370 1.0257629 1.0333519
 [869] 0.9946783 1.0470737 1.1096393 1.0026018 1.1145142 1.1445823 0.9867584
 [876] 1.0003261 0.9797200 1.0089843 1.1779519 1.2084318 0.9961355 0.9713807
 [883] 1.0742282 1.2014802 0.9867937 1.2698922 1.2109230 1.0273577 0.9637670
 [890] 1.0616029 1.0600848 1.0139293 0.9961194 1.0269324 0.9715343 0.9638087
 [897] 1.1409295 1.1031586 1.1149401 0.9803577 1.4655977 1.1155247 0.9515526
 [904] 1.0481510 1.1377291 1.0182933 0.9368684 1.0043055 0.9669634 0.9594438
 [911] 1.3584304 1.0877467 0.9589755 0.9890008 1.0606180 1.1329991 0.9792342
 [918] 1.2919442 1.3266703 1.0275927 1.0121592 1.2652962 1.0034580 1.0374905
 [925] 1.0002325 1.0747261 1.1254204 1.0384867 1.3258942 1.0565371 1.1234815
 [932] 1.2366763 1.0025703 1.0682353 1.0861323 1.0620446 0.9868255 1.0412434
 [939] 1.0395629 1.1468791 1.3282266 0.9528481 1.0098972 1.0283327 1.0825420
 [946] 1.0201316 1.0702965 1.0897533 1.0431765 0.9722249 1.0736728 1.0083289
 [953] 1.0481917 0.9968491 1.3207855 1.0469241 1.0265758 1.0263104 0.9868255
 [960] 1.0090250 1.1730423 1.1119752 1.1607030 1.0678901 0.9562778 1.1246900
 [967] 0.9857312 0.9948710 1.2098536 1.3549643 0.9762993 1.0789935 0.9762185
 [974] 0.9925722 1.2252721 1.1750312 1.4422631 1.1849990 1.2160739 1.4214106
 [981] 0.9973500 0.9751233 0.9977710 1.0047247 1.2923562 1.0538240 1.4395690
 [988] 1.0777950 1.1425948 0.9899116 0.9817444 1.0881311 1.1365564 1.4364192
 [995] 1.2850494 1.0807683 0.9715298 1.1001404 1.0277324 1.2910464 1.1735625
[1002] 1.0291197 1.0716893 1.0731621 1.1529868 1.2496569 1.0099842 0.9647211
[1009] 1.0583583 1.1318697 1.0082695 0.9998979 1.0273751 0.9795499 0.9462381
[1016] 1.0220337 1.0328778 1.3641773 1.1136451 1.0311129 1.4444081 1.0592105
[1023] 0.9557575 1.3270931 1.1835562 1.0330223 1.1265008 1.0729397 1.0023568
[1030] 1.0808295 1.1880339 1.3212517 1.1707126 1.1751197 1.0654139 0.9795499
[1037] 1.0332205 1.1053590 0.9830178 0.9783709 1.0423428 1.0924172 1.2361798
[1044] 1.0192122 0.9570132 1.1471687 1.0187069 1.0265655 1.1109708 0.9979147
[1051] 0.9665944 0.9959423 1.2964372 0.9792883 1.1885241 1.1246683 0.9598871
[1058] 1.2328467 1.0357066 1.0170622 1.3437701 1.0980860 1.2601156 1.0214541
[1065] 0.9861376 1.1968423 1.0582707 0.9831966 0.9911326 1.0007446 1.0463784
[1072] 0.9919909 1.1054024 1.0173125 1.1072670 1.0197704 1.0058174 1.2702384
[1079] 1.3974992 0.9940719 1.1072473 1.1230290 1.0712771 1.0914934 0.9766604
[1086] 1.2684662 0.8781560 1.0095660 1.3628772 0.9917249 1.2208729 1.0227655
[1093] 0.9864452 1.0995265 1.0547740 0.9902310 0.9917083 1.3691638 1.3134840
[1100] 1.0322863 0.9942241 1.0286000 1.2097684 0.9974562 1.0124107 1.1069117
[1107] 1.0390820 1.0506674 1.0058951 1.0185816 0.9935348 0.9851806 0.9932695
[1114] 1.2295038 1.0018604 1.1786244 0.9835948 1.0453958 1.3071426 1.1602687
[1121] 1.0769197 1.0025722 0.9751107 1.5202385 1.6044291 1.0457248 1.1616942
[1128] 1.1596437 0.9574425 0.9926950 1.0733715 1.1151860 1.0833544 1.0237130
[1135] 1.1901270 0.9905403 0.9921366 0.9739825 0.9836287 1.0369376 1.0087006
[1142] 1.2168292 0.9964628 1.1885221 1.1996412 1.0770295 1.0088762 1.1476790
[1149] 0.9825335 1.0872608 0.9914667 1.1390617 0.9642153 1.2543145 0.9681757
[1156] 1.1125244 0.9726254 1.1957448 1.1849104 1.1257471 1.1780090 1.0471613
[1163] 1.2210298 1.0061357 1.1215953 0.9602172 1.0430121 1.0827321 1.3737475
[1170] 1.2405229 1.1531440 1.0136179 1.0619265 1.1057411 1.0032915 0.9499697
[1177] 1.1354683 0.9961138 1.0035033 1.2599636 1.0640006 1.0271221 0.9975807
[1184] 1.0219078 1.3480519 1.1018777 1.0883801 0.9541229 1.0298599 1.1235112
[1191] 1.1622968 1.0235857 1.0347611 1.0122687 1.3003665 0.9485189 1.0097788
[1198] 0.9704817 1.4513557 1.0734446 1.0005751 1.1863622 1.1874756 1.0334341
[1205] 0.9888115 0.9835948 1.1213838 0.9875373 1.0667044 1.5154686 1.0563269
[1212] 1.2300002 1.6627443 0.9730003 1.0596668 1.3256897 1.0513783 0.9575718
[1219] 1.0359738 1.0837301 1.0425034 1.0641119 0.9400370 0.9992297 1.0331782
[1226] 1.0070740 1.0207316 1.1301832 0.9730221 0.9810387 0.9949476 1.3799597
[1233] 1.1529657 1.1327156 0.9414369 1.0284415 1.0066913 1.0635772 1.0936312
[1240] 0.9788736 1.0259536 1.0158101 1.3111951 0.9705817 1.0193554 1.0377593
[1247] 1.0005562 1.1697950 1.0155810 1.0334341 1.0077344 0.9957469 1.0585792
[1254] 0.9919651 1.0279018 0.9741555 0.9675088 1.0462311 1.0592299 1.2681554
[1261] 1.1882555 1.1800606 1.1487906 0.9927525 1.1523657 0.9977533 1.0865682
[1268] 0.9642236 1.1692456 1.2409807 0.9676616 1.1518802 1.0193071 1.2003595
[1275] 1.1569854 1.0171608 1.0156754 0.9614797 1.2825396 1.0032915 0.9716334
[1282] 1.4061077 1.1667417 1.1464837 1.1345126 1.1737562 1.0103831 0.9905288
[1289] 1.2037190 1.2869831 1.2933214 1.1282862 1.0281042 1.0797127 1.1883424
[1296] 1.1347260 0.9851445 1.0188003 1.1751914 0.9566372 0.9744963 0.9988669
[1303] 1.0853586 1.1011230 0.9591619 1.0079188 0.9335595 0.9762122 1.1947038
[1310] 0.9960465 1.1462693 1.0359869 1.1658427 1.0813666 1.4265420 1.0062955
[1317] 1.0395174 1.1479588 1.0174411 1.0558647 0.9842316 1.1076149 1.0915215
[1324] 0.9454183 0.9726029 1.2463177 1.1925399 1.0043538 1.0721178 1.2221655
[1331] 0.9598749 0.9957971 1.0288280 0.9368684 1.3430387 1.0308133 1.0656980
[1338] 1.4646060 1.4551272 1.1664777 0.9967203 1.2895237 1.0568371 1.0134293
[1345] 1.3329616 1.4164871 1.0292786 0.9715425 1.0078737 1.0269640 1.0332188
[1352] 0.9969594 1.0014787 0.9779281 1.1517426 1.1459531 1.1193505 1.0101497
[1359] 1.0948623 1.1084394 0.9214715 1.0135611 1.1885399 0.9589755 0.9962852
[1366] 1.1830923 1.0704547 1.0371658 1.0262313 1.0130880 0.9537620 1.5878108
[1373] 1.0245251 0.9902484 1.0534856 1.0062684 1.0214888 0.9921407 1.0029469
[1380] 1.6465472 0.9992265 0.9719854 1.0036090 1.0280870 1.0073123 0.8781560
[1387] 1.0372981 0.9991054 0.9538271 1.2297109 0.9614670 1.0298262 1.1025126
[1394] 1.0581073 1.2235999 0.9965621 1.0242391 0.9957398 1.0461645 1.0351728
[1401] 1.0647476 1.0179083 0.9843666 0.9691868 1.2080521 1.0619506 1.0276545
[1408] 1.1578403 1.0032807 1.3771870 1.1058795 1.0783549 0.9747552 1.1755869
[1415] 1.0468123 1.2872709 1.0478585 1.0242311 1.0052297 1.1193270 0.9296050
[1422] 1.2635653 0.9917894 1.0908327 1.0634061 1.0916977 1.1040236 0.9570438
[1429] 1.1034621 1.0487376 1.0281120 1.0093055 0.9952193 1.0420102 1.0001307
[1436] 0.9884163 1.0700089 0.9458680 1.0561292 0.9636485 0.9782151 0.9154886
[1443] 0.9737639 0.9958779 1.1244097 1.0322326 1.0679695 1.0626406 1.0046647
[1450] 0.9853115 1.0709312 0.9818285 0.9801836 1.2409807 1.1541968 1.0006142
[1457] 1.2078726 1.2983598 1.0341614 0.9931440 0.9724391 1.1019661 1.5235847
[1464] 1.2296347 0.9679559 1.1713064 1.0606874 1.0957662 1.3072104 0.9776954
[1471] 1.0065308 0.9841015 0.9924043 1.3607493 1.0673040 1.1944170 0.9870520
[1478] 1.0480024 1.1334758 1.1900146 1.0014521 0.9808229 0.9671384 0.9154886
[1485] 1.0916601 0.9958106 0.9964870 1.0609856 0.9889133 1.0091647 1.0251254
[1492] 1.1281433 0.9837062 0.9853353 1.0042996 1.8835043 0.9899103 1.3330525
[1499] 0.9541229 1.1163378 1.1043623 0.9994520 1.4183175 1.0781661 1.0588854
[1506] 2.0084403 0.9901978 1.0200279 1.0025703 0.9822163 1.1650294 1.0106484
[1513] 1.0143642 0.9735926 1.1057214 0.9915415 0.9983694 1.5314965 1.0179943
[1520] 1.0800660 1.3551469 1.0087721 1.0255481 1.0496125 1.1516874 1.0362305
[1527] 1.3421087 0.9886113 1.0121357 0.9714049 0.9574712 0.9312992 1.0197236
[1534] 1.0326886 1.0961708 1.4742026 0.9621396 1.1267797 1.0071530 0.9578943
[1541] 1.1600435 1.0127667 0.9609204 1.0320837 1.0221569 0.9838283 1.1183676
[1548] 1.0635366 1.2117392 0.9837958 0.9704176 0.9692107 1.1754051 1.1825193
[1555] 1.0610710 1.0238079 0.9944815 1.0229951 1.2391907 1.2749628 0.9974764
[1562] 1.1730653 1.3525062 1.0875272 0.9879636 1.2015550 1.0516103 0.9343691
[1569] 0.9980291 0.9598871 0.9652839 1.0159191 0.9699918 0.9957959 0.9526666
[1576] 1.7040997 1.3178965 1.0074919 1.1983934 1.0477569 1.1872396 0.9994661
[1583] 1.1308655 1.3867256 1.1638076 1.0254070 1.2387751 0.9755443 1.0159532
[1590] 0.9875123 1.1518949 1.0070931 0.9747552 1.1916262 1.1190355 1.1389255
[1597] 1.1636039 1.0706017 1.1391554 1.6412340 1.0065821 1.3138994 0.9650305
[1604] 1.0206716 1.0446372 1.0527012 1.0243578 0.9972553 1.0590475 1.2531814
[1611] 1.0736387 1.0332000 0.9942431 1.2943579 1.0014391 1.0834255 0.9895612
[1618] 0.9379173 1.2491624 1.2025640 1.0506477 1.0689720 1.0725363 1.0403074
[1625] 0.9949820 1.0972553 1.2022485 1.0790483 1.1106426 1.0203055 1.0179850
[1632] 1.1742652 1.0299152 1.0092762 1.2847478 0.9597142 1.0013525 1.0660382
[1639] 1.0194559 1.1939207 0.9634120 1.7000594 1.1273577 1.1299477 1.5390547
[1646] 0.9770255 1.1987197 0.9912944 1.2310012 0.9538172 0.9533534 1.0100672
[1653] 1.0094838 1.1904220 1.0367799 1.1755724 1.0032393 0.9948710 0.9916121
[1660] 1.0253562 1.0095447 1.1397505 1.1786757 1.1060122 0.9977724 0.9778170
[1667] 1.0050037 0.9551081 1.0684789 1.0480867 1.2194970 1.1140942 1.0867517
[1674] 0.9829992 0.9806471 1.0017690 1.0418322 0.9847842 1.7129192 1.0808455
[1681] 1.3729983 1.0815678 0.9835129 0.9943615 1.2580439 1.1676118 1.3555346
[1688] 1.1095531 1.0693036 0.9873216 1.0079187 1.1478379 1.0099995 1.0785433
[1695] 0.9770255 1.0108158 1.1264162 1.0075628 1.2229574 1.3201642 0.9838218
[1702] 1.1363632 1.0960466 1.0288489 1.1317309 1.0343905 1.0242404 1.0255781
[1709] 1.3689362 1.0857421 0.9827181 1.0945418 1.0246817 1.1380701 1.0322286
[1716] 1.0037925 1.1140838 1.0840948 1.1631844 1.0222633 0.9879756 0.9810190
[1723] 1.0980866 1.0058174 1.0039647 1.2635894 1.0151435 1.5521434 1.4076619
[1730] 0.9536089 0.9634120 1.0583440 1.1228817 1.0268087 0.9758737 0.9688601
[1737] 0.9797975 0.9624179 1.0542169 1.1865297 1.0399916 1.0723771 1.0902580
[1744] 1.0682438 1.0155528 0.9845443 1.6735127 0.9381896 0.9991439 0.9875995
[1751] 1.0867935 1.1276844 1.2966110 0.9852834 0.9949476 0.9863435 1.0123276
[1758] 1.0705407 1.0860725 1.0055677 1.1408862 1.0094848 1.2031114 0.9821412
[1765] 1.0145422 1.2106733 0.9792342 0.9343691 1.1004612 1.1439058 1.0011464
[1772] 1.3830110 1.1232181 0.9733356 1.3519736 1.3735714 1.3141993 1.2110152
[1779] 1.1122684 1.1092301 0.9813636 0.9989995 0.9867937 1.0488878 0.9453876
[1786] 1.0490554 1.1001904 1.0067500 1.1444596 1.1447240 0.9891705 0.9973348
[1793] 0.9103036 0.9437080 0.9638087 0.9574425 1.0003153 1.2491647 1.0014665
[1800] 1.1822416 1.0761739 0.9970625 0.9701101 1.1597332 1.2113055 0.9984515
[1807] 0.9715425 1.3810016 0.9843666 1.1867679 1.0817519 0.9831795 1.1680706
[1814] 0.9737981 1.0406200 1.4723837 1.1569766 0.9902484 1.0166217 1.3581148
[1821] 0.9646614 1.1567410 1.0020584 1.1915295 1.0074600 1.0506567 1.6847426
[1828] 1.4707948 1.1317006 1.0134293 1.0137104 0.9774971 0.9715477 1.1284403
[1835] 0.9995482 0.9470923 1.0760619 1.0807683 1.0614203 1.0070035 1.0422200
[1842] 1.0521085 1.0352854 1.0903309 0.9754837 1.1326207 1.0408671 1.0920288
[1849] 1.1951538 1.0199868 1.0727543 1.1714719 1.4598572 1.0010632 0.9770813
[1856] 1.0042583 0.9969926 0.9970266 1.1787563 0.9963623 1.0003171 1.2914440
[1863] 1.0748454 1.0525602 1.0488136 1.0422410 1.1102311 0.9941808 0.9521001
[1870] 0.9224644 1.0027236 0.9903782 0.9823479 0.9781771 1.0028387 1.1044362
[1877] 1.1912515 0.9829543 1.0934085 1.1986284 1.0044393 0.9956316 0.9878532
[1884] 0.9985388 0.9938532 0.9902547 1.0453249 1.0243704 1.0012130 1.0958402
[1891] 1.0949625 1.0890988 1.0114553 1.0134060 1.2574622 0.9867584 1.1979542
[1898] 1.1574914 1.0143747 1.1566846 1.2046619 1.1592943 0.9597021 0.9916911
[1905] 0.9618405 1.0277227 0.9950143 1.0245251 1.1143045 1.0190233 1.0042132
[1912] 0.9970073 0.9730221 1.0817418 0.9808229 1.0074541 1.0020173 1.0233410
[1919] 0.9487408 1.0158297 1.0010632 1.1789089 1.0430565 0.9649858 1.2698545
[1926] 1.0533525 0.9981017 1.0700140 1.1172350 1.2907326 1.0778034 1.0068873
[1933] 1.0873180 1.1892282 0.9640910 1.0161298 1.2060886 1.0193905 1.1565298
[1940] 1.0085457 1.1109686 1.1023873 1.0640484 1.0036142 1.1274069 0.9905550
[1947] 0.9861690 1.0578974 0.9909457 0.9987318 0.9695866 1.1852140 0.9683407
[1954] 0.9668669 1.0907586 1.0626851 0.9846026 1.0138338 0.9605433 1.0609845
[1961] 0.9830598 0.9647727 1.0021316 1.0970175 1.6470659 1.1022977 1.1690710
[1968] 1.0024068 0.8633720 1.0406546 1.0132553 1.0143531 0.9884328 0.9876322
[1975] 1.0040190 0.9880791 0.9974562 1.0908166 1.4662367 1.0635063 0.9984886
[1982] 1.0464518 1.0676386 1.0139305 1.2418874 1.0200054 0.9920575 1.1058542
[1989] 0.9870520 1.1700394 1.5802615 1.2622742 1.2380390 0.9290160 1.0889439
[1996] 0.9629980 1.0057624 1.0387594 0.9837399 1.0061420 1.3062835 1.0070931
[2003] 1.0145980 1.0890431 0.9861690 1.0009262 1.0009544 1.0472589 0.9783355
[2010] 0.9574712 1.0635908 0.9841480 0.9795499 1.2611688 0.9641495 0.9871628
[2017] 1.0136179 0.9803347 1.0932795 1.2718432 0.9453876 0.9464707 1.0241122
[2024] 1.0388219 0.9887496 1.1020119 0.9767642 1.0363490 0.9739825 1.0734016
[2031] 1.0175936 1.0820417 1.0386615 0.9805624 0.9886599 1.0703916 0.9873992
[2038] 1.0044088 1.0071835 1.9860861 0.9701101 0.9518782 1.0158496 1.1107856
[2045] 1.1187531 1.0286269 1.0436893 1.1036435 1.1072469 0.9878860 1.0499175
[2052] 1.1261234 1.0151780 0.9615714 1.3755231 1.2627888 1.0046767 0.9989703
[2059] 1.2281533 1.1746656 1.0272316 1.0172953 1.0367675 1.0474157 0.9597142
[2066] 1.3475907 0.9531403 1.0415572 1.1816788 1.0188424 1.0652997 1.1607537
[2073] 1.2349345 1.0761739 0.9698538 0.9697408 0.9913867 0.9744827 0.9991287
[2080] 1.1435441 1.1376754 1.3564838 1.0969584 1.1001404 1.0470623 0.9601846
[2087] 1.0244273 1.3684796 1.1249965 0.9915260 1.0226372 0.8716886 1.0152977
[2094] 1.0445208 1.1234719 0.9810688 1.3803387 1.0282898 1.1119553 1.0554149
[2101] 1.2813857 1.1603708 1.1156857 1.3150768 1.0299693 1.0287797 1.0075333
[2108] 1.0536057 1.0492926 0.9731497 1.2189197 0.9716090 1.0510219 1.0818552
[2115] 1.0715866 1.1534019 1.2143814 1.4815498 0.8688182 0.9893043 0.9640025
[2122] 1.3047378 0.9565361 1.0356739 0.9845819 0.9487408 0.9526666 1.0144492
[2129] 1.0774640 0.9465930 1.0845187 1.1980632 1.1045404 1.1512879 1.0166716
[2136] 1.0600571 1.0158393 1.0031187 1.1662346 1.4392610 0.9967977 0.9765333
[2143] 1.0427838 0.9768038 1.0732555 1.2805709 0.9903969 1.0292786 1.3510129
[2150] 1.1588824 0.9996821 0.9820161 1.2777040 1.1331843 1.2272026 1.0061357
[2157] 1.0679348 0.9642189 1.0497969 1.0487302 1.0784537 1.1535059 1.0791570
[2164] 0.9826355 1.4074918 1.1922696 1.0702330 1.0098533 0.9788736 0.9988259
[2171] 1.0185483 1.0193680 1.0349627 1.3041501 1.3535041 0.9760724 1.0955514
[2178] 1.1809780 0.9728065 1.0576942 0.9983591 1.4610472 0.9902484 1.0250880
[2185] 1.1898221 1.0472679 0.9950283 1.1999682 1.1536470 1.2012203 1.0708402
[2192] 1.0394699 0.9913489 1.0118595 1.0878315 0.9852868 1.2599479 1.0458669
[2199] 1.0799793 1.0070035 1.0914254 1.0054986 1.5324962 1.1143173 1.3871882
[2206] 1.0033524 0.9952440 1.2408388 0.9918144 0.9742663 1.0331650 1.0404056
[2213] 1.0263691 1.0736014 0.9512265 0.9984886 1.3927564 0.9806636 0.9883637
[2220] 1.0773578 0.9943524 1.2339360 1.0404052 1.4341433 1.0756168 1.1493415
[2227] 0.9485189 1.4295457 1.0586065 0.9698974 0.9931140 0.9712453 1.1177427
[2234] 1.0633430 0.9955011 0.9692021 1.1593345 1.5360721 1.0615306 1.0137817
[2241] 1.0076562 1.3244653 0.9912137 0.9958106 1.0863678 1.2329748 1.0428111
[2248] 1.0039647 1.0304976 0.9969332 0.9843809 1.0954487 1.0166867 1.0128431
[2255] 1.1456304 1.0046954 1.1757722 1.1509452 1.1544467 0.9977243 1.0192473
[2262] 1.0185204 1.0123747 0.9741896 0.9875151 1.2439392 1.0197236 0.9923291
[2269] 1.4239703 1.1462693 1.0046952 1.0997777 1.3255514 1.1123861 1.0247109
[2276] 1.0347530 1.0050989 1.2584223 0.9574425 1.1156072 1.0036090 1.3310147
[2283] 1.0135005 1.0694916 1.0058174 1.0074182 0.9983338 1.0267806 1.1425091
[2290] 0.9682051 1.2350831 1.0195965 1.1486533 1.0473019 1.1535700 0.9945328
[2297] 0.9856162 1.1325573 1.1893531 1.2266268 1.3756345 0.9558131 1.0267974
[2304] 1.1949955 1.0991414 1.0319618 0.9910409 0.9847447 0.9660350 1.1859864
[2311] 0.9905009 1.0564145 1.0452238 0.9813989 1.0361926 1.2438054 1.1058795
[2318] 0.9748729 1.0094541 0.9891061 0.9676610 1.0692625 0.9952869 1.0651352
[2325] 0.9562778 1.1904220 1.0437021 1.0418322 1.1387983 1.0656019 0.9911285
[2332] 1.1941649 1.0995037 0.9997546 1.4108385 1.0821005 1.1356343 1.0070083
[2339] 1.0780883 1.0502868 0.9820161 0.9769844 0.9955536 1.1334559 0.9860054
[2346] 0.9697408 0.9739065 0.9224644 1.0544633 1.0533330 1.2495675 1.1867188
[2353] 1.0741689 0.9755573 0.9946953 1.0287971 0.9825925 1.0193071 1.0196834
[2360] 1.1544187 1.0581517 0.9761176 0.9787816 1.2070663 0.9979384 1.0210227
[2367] 0.9812474 1.6376117 1.0029692 0.9891719 0.9963378 1.0548469 1.0663191
[2374] 1.5112746 0.9589797 1.0075467 1.1700493 1.0143602 1.0011464 0.9944802
[2381] 0.9907913 1.0401399 1.1308471 0.9718687 1.3277746 1.6168777 1.1431777
[2388] 0.9666904 1.0532022 1.0165042 0.9619179 1.0500670 1.2351353 1.0114385
[2395] 1.0205454 1.1363809 1.0137164 1.0027236 1.0496147 0.9704176 1.0285212
[2402] 1.2859347 1.3713061 1.2578729 1.2096268 0.9920180 1.3422433 1.0234980
[2409] 1.0132712 0.9978833 0.9787973 1.2516682 1.0407495 0.9875151 1.0212884
[2416] 1.0248283 0.9918512 0.9624179 1.1596507 0.9895309 1.1444846 0.9910089
[2423] 1.1287040 1.0231006 1.2605287 1.0551123 0.9296050 1.0626056 1.2143982
[2430] 0.9843798 0.9772214 0.9696254 1.1126739 1.0034271 1.3019003 1.2819887
[2437] 1.1902358 0.9614670 1.2796985 1.0163011 1.0211390 1.7422306 0.9817567
[2444] 1.1624821 0.9597021 0.9670737 0.9822380 1.5856217 1.0667233 1.0118496
[2451] 0.9830643 1.0609856 0.9642236 1.3541970 1.1948581 0.9967745 0.9275098
[2458] 1.0015158 1.0080871 1.0086427 1.0941005 0.9698839 0.9856300 1.0853586
[2465] 1.0594791 1.2121516 1.0738088 0.9876322 0.9811999 1.1767919 1.0120946
[2472] 1.0764902 1.0011147 1.0015218 1.2075082 1.0532446 1.2731305 0.9473242
[2479] 1.0309732 0.9866734 1.0005719 1.0392631 0.9955259 1.0504420 1.0171199
[2486] 0.9405865 1.1585181 1.1649241 1.0745082 0.9549943 1.1340287 1.0164758
[2493] 1.0244231 0.9768445 1.1614082 0.9998856 0.9290160 1.2278805 1.0800196
[2500] 0.9536089 1.3379282 0.9721577 0.9698974 1.0034375 1.1076173 0.9754837
[2507] 0.9861111 1.1914092 0.9953481 1.1236147 1.5066607 1.4033283 0.9905288
[2514] 1.1208494 1.0645746 1.0471418 1.1630050 1.1405095 1.0343701 1.0841798
[2521] 0.9873170 1.2056645 1.0719018 1.2819887 0.9103036 1.2431475 0.9776161
[2528] 1.1576728 1.0179076 1.0562714 0.9991439 0.9976252 1.1524929 1.2230164
[2535] 1.0280525 0.9940719 1.0487123 1.0597477 1.0200054 1.4997890 1.3743819
[2542] 1.2126874 1.0125063 1.0277646 1.3240130 0.9812747 1.0301754 1.0792439
[2549] 0.9740560 1.0518189 1.2523194 1.0459780 1.0722468 1.2272725 1.0463900
[2556] 1.1031442 0.9735926 1.0985668 1.0171831 1.6570495 0.9970073 0.9896986
[2563] 1.0429119 1.0308411 1.0187408 1.0242044 1.2194970 1.1173706 1.0135924
[2570] 0.9853799 1.0672902 1.3004972 1.1456999 1.0751484 0.9901723 1.1116132
[2577] 1.0916601 1.1872928 0.9744729 1.0096552 1.0100348 0.9598749 0.9711143
[2584] 1.0990666 1.0183545 1.0091548 1.0450523 0.9963123 1.1589526 0.9409887
[2591] 1.0213822 1.0020030 0.9742663 1.0473003 1.2533719 0.9679140 1.1091227
[2598] 1.0381446 0.9632606 1.0786260 0.9956316 1.4334881 1.2341852 1.3406264
[2605] 1.1699012 0.9918144 0.9969220 0.9719854 1.2070380 1.0897239 1.4482789
[2612] 0.9675731 1.5041423 1.0399273 0.9852646 1.0095203 1.0867935 1.0091019
[2619] 1.6490497 1.1115787 1.1622895 1.0694314 1.0165042 1.1180659 1.1450788
[2626] 1.0064131 1.1488863 1.0467342 1.1465366 1.1865970 0.9805177 1.0012130
[2633] 1.0817932 1.3532065 1.2024621 0.9788493 1.1136032 1.1152531 1.0489561
[2640] 1.3816735 1.1104065 0.9340068 1.2781556 0.9994661 0.9624113 1.1201049
[2647] 0.9755639 1.0963510 0.9972556 0.9366979 1.3617584 0.9730805 0.9533657
[2654] 1.3238356 0.9647211 1.0146086 0.9734837 1.0065046 1.0817519 1.0239535
[2661] 1.0708325 1.0512169 0.9982035 1.0637160 1.0097158 1.0591911 1.4708927
[2668] 0.9752461 0.9949820 0.9888006 1.0023431 0.9957398 0.9871465 1.0014391
[2675] 1.0581887 1.0211566 0.9837399 0.9770255 1.1957078 1.0420834 1.1019908
[2682] 0.9831966 0.9818755 1.3541957 1.0035013 0.9993903 1.0043525 1.0218357
[2689] 1.0391853 1.0481648 0.9964628 0.9833169 1.1308727 1.0287407 1.1102932
[2696] 1.2097684 1.1903993 1.1216055 1.2786397 1.1962469 0.9770845 1.1774311
[2703] 1.2074258 1.0438507 1.4158551 1.0500729 1.0018195 1.0306242 1.5103678
[2710] 1.0605103 1.0471041 1.0556414 1.0103831 1.1882832 1.0378119 0.9927525
[2717] 1.1935573 0.9772214 1.1701655 0.9911532 1.0062230 0.9594427 1.1734922
[2724] 0.9982024 0.9991287 0.9875997 1.0919933 0.9586389 1.1168892 1.2488112
[2731] 0.9602044 1.3150568 0.9931347 1.2421956 1.0542470 1.0071217 0.9837350
[2738] 1.1081878 1.1496577 0.9761046 1.5366120 0.9927525 1.2401083 0.9956434
[2745] 1.0589819 0.9652077 1.2171780 0.9866605 1.1090890 1.2822277 1.0397303
[2752] 0.9742066 1.2457213 1.0145922 1.0128691 1.3483666 1.2859039 0.9650305
[2759] 0.9992939 1.0511184 1.0301431 1.0134354 1.1076675 1.0213160 0.9458285
[2766] 1.0449240 0.8716886 1.0576477 1.2577890 1.2705728 1.0276951 1.1721314
[2773] 0.9916121 1.0844928 1.0160955 1.0257275 0.9963623 1.1127091 1.0245196
[2780] 1.1867693 0.9574988 1.1179751 1.0392631 0.9942431 1.0920539 1.0647149
[2787] 1.0057624 1.0523989 1.0532837 1.0763096 0.9893819 0.9610054 1.1764287
[2794] 1.0766961 1.0548469 1.1504186 1.1947865 1.1740601 0.9726254 1.0876511
[2801] 1.0701582 1.2304105 1.0089367 0.9442907 0.9914667 0.9909253 0.9604546
[2808] 0.9981785 1.0677163 0.9941388 0.9950749 1.1022361 0.9953212 1.0080377
[2815] 0.9787790 0.9905403 1.0841198 1.0067120 1.0148949 0.9968423 1.0537662
[2822] 1.1447131 1.3410403 1.0640484 0.9919435 0.9813758 1.0194117 1.0592299
[2829] 1.0063054 1.0114224 1.0202130 1.0825647 0.9929679 1.1109686 1.1063877
[2836] 1.0020030 1.0267636 1.1110560 1.1855250 1.0110552 1.0031199 0.9949260
[2843] 1.1173818 1.5210367 1.0331888 0.9949476 1.3980418 1.0191759 1.0747054
[2850] 0.9692720 1.1510401 1.0949691 1.2008290 0.9584710 1.0092576 1.3975629
[2857] 1.0809692 1.0060747 1.1844029 1.0809692 1.2605618 1.1711067 1.7600631
[2864] 1.0091548 0.9927511 0.9977724 0.9618796 1.0126972 1.1140215 0.9965925
[2871] 1.0024068 0.9894207 0.9735864 0.9789060 1.1035300 1.0023721 0.9944317
[2878] 1.1039894 0.9605433 1.1345486 1.0900087 1.1581998 1.1229415 1.0022458
[2885] 1.1559856 0.9896117 0.9909321 1.1230518 0.9902047 0.9696920 0.9582359
[2892] 1.0956137 1.1474913 1.0264415 1.1066589 0.9908998 1.0188213 1.1107529
[2899] 1.0641110 0.9617003 0.9861349 0.9908923 1.0137762 0.9957469 0.9660951
[2906] 1.1681339 1.0879215 1.1190623 1.0562476 1.2283654 0.9641495 1.0884246
[2913] 0.9224644 1.1147732 1.0709688 0.9775487 1.3536253 1.0391343 1.0997547
[2920] 1.3439992 1.3547465 1.0522989 0.9871568 1.1556792 0.9960906 0.9997308
[2927] 0.9886949 1.0291601 0.9953902 0.9489056 0.9891429 1.0056250 1.0200279
[2934] 1.1949193 1.1416069 0.9977243 1.0254017 1.4534560 0.9812040 1.0821549
[2941] 0.9458680 1.1573515 0.9909321 1.3622454 1.0002363 0.9931140 0.9606424
[2948] 1.0041014 1.1403350 1.1743160 0.9605433 1.1029770 1.0929158 0.9642236
[2955] 0.9819329 1.1007228 0.9843798 1.0076546 1.0720436 1.3130800 1.0215537
[2962] 1.0744022 0.9833306 1.0057489 1.0434102 1.1427854 1.0982429 0.9819083
[2969] 0.9801836 0.9983970 1.0980385 1.0308908 1.3484985 1.0273820 1.0377824
[2976] 1.1940484 1.0275927 1.0647476 0.9794505 1.0334176 0.9710251 1.0258257
[2983] 1.0509970 1.0439248 1.0017690 1.1162397 1.3510129 0.9845819 1.0926174
[2990] 1.0138462 1.2043124 0.9742663 1.2096325 1.0597794 0.9804852 1.1198237
[2997] 1.1664352 1.7402901 0.9909321 0.9742530 1.0046305 1.0928173 0.9578943
[3004] 1.0077811 1.1245126 1.0367245 1.1772784 1.1617314 1.0091063 1.1043413
[3011] 0.9898201 0.9940719 1.0258963 0.9695753 1.0924523 1.0684884 0.9652839
[3018] 1.0091548 1.0963339 1.0248657 1.0669389 1.1838028 1.0571446 0.9730221
[3025] 0.9853995 1.0601124 1.0255781 0.9335595 0.9951504 0.9845474 1.0616011
[3032] 1.1084992 1.0656560 1.1065254 1.1607206 0.9619179 1.0331782 1.0435712
[3039] 1.0987718 1.1869215 0.9938151 0.9951015 1.0271191 1.1316636 1.1344203
[3046] 1.0018525 0.9859442 1.1718736 1.0755218 1.0367762 1.0153659 1.0608156
[3053] 1.0379963 1.2180196 0.9812658 0.9707019 1.0281048 0.9892611 1.0281989
[3060] 1.1227402 0.9968301 0.9736744 1.0377000 0.9808226 0.9721577 0.9641948
[3067] 1.0334963 1.0037925 1.0821005 1.0086178 1.2670488 1.0205748 1.1204206
[3074] 1.0237057 0.9859044 1.1937048 1.0235700 1.0935133 0.9990950 1.1353173
[3081] 0.9873301 1.0399962 1.3665673 1.0751720 1.1470426 0.9802454 1.0941123
[3088] 1.1026484 1.0392535 1.1193437 0.9591570 1.0202806 1.1414274 1.1943064
[3095] 1.2188938 0.9841102 1.0892239 1.0022748 1.0214299 0.9621396 1.4462625
[3102] 1.0779368 1.0928173 0.9932437 0.9766637 1.3206522 1.0297782 1.0443974
[3109] 1.1097727 1.0580027 1.0164758 1.1843589 1.3538887 1.3578104 0.9614797
[3116] 1.0338964 1.2988049 1.0411452 0.9990310 1.0243601 1.0468916 1.0437046
[3123] 0.9779271 0.9886414 0.9977427 1.1152530 1.1567738 1.9228901 1.0775384
[3130] 0.9942694 0.9437080 1.0173231 0.9831067 0.9822380 0.9786479 1.3271519
[3137] 0.9354724 0.9841015 1.1018995 1.0472057 0.9646474 1.1149794 1.2996080
[3144] 0.9982028 0.9981785 0.9612486 0.9572970 1.0338206 0.9901012 1.2546600
[3151] 0.9570438 1.0424087 0.9487408 0.9878762 1.0562101 1.0143531 1.0511863
[3158] 0.9275098 0.9744177 1.0824684 1.1867428 1.0193196 1.2609457 1.1808327
[3165] 1.0018525 1.3641020 1.0508725 1.0570180 0.9782389 1.0235668 1.0858977
[3172] 1.0307431 1.0259808 1.0611302 1.0353314 1.0129264 1.0219973 0.9953117
[3179] 1.0928909 0.9841480 1.0248657 1.0188547 1.0118496 1.0954130 0.9614670
[3186] 1.6429925 1.1201049 0.9866734 1.0002976 1.0499042 1.0156512 1.0099971
[3193] 0.9984886 0.9781899 1.0506477 1.2564873 0.9660951 1.0048137 1.3636229
[3200] 0.9685183 0.9525068 0.9755573 1.3110506 1.3307373 0.9921407 0.9898173
[3207] 0.8769853 1.0037551 1.0126969 1.0150139 1.0393273 1.3720663 1.1020325
[3214] 1.0623686 0.9639534 1.1323635 1.1520803 1.0873886 1.0218677 0.9898955
[3221] 1.1833247 1.0078082 0.9873992 1.2607856 0.9829107 1.0789873 1.1377479
[3228] 0.9880791 0.9843252 0.9619192 1.0721157 1.0070083 1.8916069 1.0797084
[3235] 1.0013525 1.3647569 0.9973681 1.1165937 1.0801414 1.2311888 1.0233053
[3242] 1.1226920 0.9681591 0.9802766 1.1314046 1.1825412 1.1750325 1.1309520
[3249] 1.0023257 1.2052630 1.1660537 0.9492247 0.9708341 1.1343517 1.0826167
[3256] 1.0587079 1.0077761 1.0196292 1.0511174 1.1034802 1.0235413 1.2349345
[3263] 1.0538519 1.2335033 1.0048796 1.0115700 1.0188003 0.9893455 1.0303533
[3270] 1.0930794 0.9873992 1.4138447 0.9985273 1.0974788 1.0594535 0.9751107
[3277] 1.0611708 1.0591447 0.9871106 0.9887800 0.9526666 1.1512152 1.0379114
[3284] 1.5134857 0.9646474 1.1099514 0.9843809 0.9880980 1.0848691 0.9970755
[3291] 1.2586771 1.0047550 1.0489824 0.9535957 1.0431824 0.9962877 0.9985085
[3298] 1.5701149 0.9542357 1.0046305 0.9715425 1.1760717 1.1820441 0.9875373
[3305] 1.1289932 1.0049886 1.0687070 1.1492391 0.9839818 1.2110396 1.3737427
[3312] 1.1601423 0.9950710 0.9539352 0.9982028 0.9841883 1.0419911 1.0163406
[3319] 1.2485976 0.9766604 0.9889641 0.9921733 0.9989039 0.9478188 1.0086427
[3326] 1.0260632 1.0277948 1.1172350 0.9755091 1.0437635 0.9696983 1.0388734
[3333] 0.9947596 1.1613346 1.1470804 1.2437278 1.0774622 1.0899792 0.9942431
[3340] 1.1147572 1.0185820 0.9627644 1.0807927 1.3105442 1.0357850 0.9669044
[3347] 0.9918953 1.0600482 1.1248524 1.1583065 1.2082892 0.9831966 1.2292605
[3354] 1.0479992 1.1637318 0.9931347 0.9705954 1.0936918 1.0125350 0.9746256
[3361] 1.1243074 1.3365228 1.0620967 1.1622647 1.2417428 1.0551060 1.0491469
[3368] 1.3461240 1.0236808 1.0186215 1.0109468 1.5775120 1.0195965 1.3138270
[3375] 0.9875123 1.1361533 1.0364212 0.9992931 1.0564914 1.0416526 1.6231416
[3382] 1.0550335 1.0467342 0.9813804 1.1149388 0.9779271 1.0488654 0.9760973
[3389] 0.9830643 1.4985825 1.4255968 1.0132712 0.9928064 0.9739019 1.0700796
[3396] 1.1179462 1.1243247 0.9908724 1.0324856 0.9825761 1.0253562 1.0212291
[3403] 1.1600612 0.9899876 0.9960145 1.1256007 1.0487493 1.0372981 1.0468631
[3410] 1.1467559 1.0028932 1.0467183 1.1454612 1.2458635 1.2978297 0.9716090
[3417] 1.0170365 0.9452326 0.9989374 1.0872608 1.1196595 0.9343674 1.0067726
[3424] 1.3566018 1.0631943 1.0850900 1.0113135 1.0183612 1.1005657 1.1019059
[3431] 1.1052422 1.0737388 0.9950062 0.9951087 0.9900424 1.4281041 1.0350757
[3438] 0.9838218 1.0808455 1.0153185 1.2810700 0.9966171 1.0802786 1.1412047
[3445] 0.9744114 1.0181197 1.0490371 1.0931690 1.0409963 0.9695753 1.0256060
[3452] 0.9843666 1.5072122 1.9671156 1.0277709 1.0198109 1.0500048 1.0025699
[3459] 1.2622580 1.0102568 1.1715637 0.9753402 1.0696421 1.5432072 1.0167299
[3466] 1.3827790 0.9961785 1.0087700 1.0490371 0.9944815 1.0581386 0.9806522
[3473] 1.0763904 0.9777411 1.0427640 1.0048773 0.9942431 1.0338206 1.0594745
[3480] 1.0136759 0.9792234 1.0029290 0.9586241 1.0039647 1.0495374 1.0536057
[3487] 0.9751303 1.1064064 1.1154354 1.2095945 1.0235831 1.1730838 1.0118496
[3494] 1.0075467 1.0143791 1.1474363 1.0263239 1.1216722 1.0433204 0.9841889
[3501] 1.0963924 1.0741621 1.0001307 1.1786038 1.3115277 0.9953212 1.0604253
[3508] 0.9873744 0.9843666 1.0353314 0.9846147 1.0942820 0.9783355 1.1539431
[3515] 1.1733624 0.9831966 0.9817444 1.2389882 0.9812315 1.2852421 0.9997182
[3522] 1.0777361 1.1712640 1.0307431 1.0289618 1.0261345 0.9743713 1.0626846
[3529] 0.9755091 1.1194913 1.0633438 1.0400799 1.0518990 0.9983073 1.2998965
[3536] 0.9844984 1.1238801 1.1386740 1.0624901 1.0358738 1.0132929 1.0591525
[3543] 1.3090053 0.9669634 1.1644360 0.9290160 1.1303928 1.0205748 1.0878065
[3550] 1.0862482 1.1662374 0.9409887 0.9735926 1.0992216 0.9837979 1.0371740
[3557] 1.2114722 0.9915356 0.9802603 1.1065702 1.0140832 1.2987547 0.9715298
[3564] 1.1017872 1.2233170 0.9801836 1.7884219 1.4258785 1.0505676 1.1561022
data_num_sin$lof <- lof_resultados #añadimos la variable lof al conjunto de datos original


# Los que tienen un LOF mayor de 1.5
lof_significativos <- 
  data_num_sin |> 
  filter(lof > 1.5) |> 
  relocate(lof, .before = "EDAD") #para que se pueda observar bien en el html

lof_significativos
# A tibble: 62 × 5
     lof  EDAD TARHOGENTREV_HH ESCFEMINIS ESCIDEOL
   <dbl> <dbl>           <dbl>      <dbl>    <dbl>
 1  1.50    21               1         10       10
 2  1.96    67               3          2        5
 3  1.51    32               2         10        6
 4  1.58    36               8          8        5
 5  1.65    25               1         10       10
 6  1.74    83              12          5        5
 7  1.60    36               6          0        4
 8  1.58    70              12          5       10
 9  1.57    58               7          5        1
10  1.74    39               2          1        2
# ℹ 52 more rows
ggplot(data_num_sin, aes(y = lof)) +
  geom_boxplot(fill = "skyblue", outlier.color = "red", outlier.shape = 16) +
  theme_minimal() +
  labs(title = "Distribución de LOF Scores")

min(lof_significativos$lof)
[1] 1.50238
max(lof_significativos$lof)
[1] 2.00844

Este gráfico es útil para entender cómo se distribuyen los outliers en dos variables, pero no refleja todo el análisis de LOF. LOF funciona en el espacio multidimensional, considerando todas las variables al mismo tiempo. Para poder visualizarlo vamos a dejar una variable fija y a representarla de manera bidimensional con el resto de variables(en este caso solo tenemos 4 cuantitativas).

#las cuantitativas
ggplot(data_num_sin, aes(x = TARHOGENTREV_HH, y = ESCFEMINIS, colour = lof)) +
  geom_point() +
  scale_color_gradient(low = "blue", high = "red", name = "LOF Score") +
  labs(title = "Detección de Valores Atípicos con LOF")

ggplot(data_num_sin, aes(x = ESCIDEOL, y = ESCFEMINIS, colour = lof)) +
  geom_point() +
  scale_color_gradient(low = "blue", high = "red", name = "LOF Score") +
  labs(title = "Detección de Valores Atípicos con LOF")

ggplot(data_num_sin, aes(x = EDAD, y = ESCFEMINIS, colour = lof)) +
  geom_point() +
  scale_color_gradient(low = "blue", high = "red", name = "LOF Score") +
  labs(title = "Detección de Valores Atípicos con LOF")

La escala de color me muestra los LOF MÁS significativos que ahora comentaremos.

LOF CON HIJOS

  • Filtramos las variables y quitamos los nas.
data_num_con <- 
  data_num |> 
  select(EDAD, TARHOGENTREV_HH, ESCFEMINIS, ESCIDEOL, CUIDADOHIJOS_HH) |> 
  drop_na()
k <- round(log(nrow(data_num_con)))
lof_resultados_2 <- lof(data_num_con, minPts = k) 

lof_resultados_2
  [1] 1.3475422 1.0673873 1.0716969 1.0684326 1.2178111 0.9637261 1.1823105
  [8] 1.0103996 1.0044820 0.9964476 1.0096313 1.0560196 1.2623161 1.1195885
 [15] 0.9901015 1.0392609 1.1014948 0.9645524 1.0247915 1.0239049 1.1484230
 [22] 0.9694183 0.9577119 0.9558967 1.0217834 1.0535602 1.1722035 0.9820919
 [29] 0.9831356 1.1086774 1.2245943 0.9732215 1.1839132 0.9999956 1.0233750
 [36] 1.1619070 0.9928243 1.1702617 1.0972074 1.1525409 1.0215587 1.4648468
 [43] 1.2875898 0.9035248 0.9996043 1.0909751 1.5022676 1.1395785 1.0311442
 [50] 0.9860327 1.2910073 1.5694753 1.2526385 1.0913849 1.0148358 1.1084578
 [57] 1.0889391 1.0405857 1.0856502 1.0897696 1.0053807 1.1075708 1.0333953
 [64] 0.9659705 1.0073952 1.0043347 1.1194585 1.2080930 1.0154332 1.0943953
 [71] 1.2079579 1.1221897 1.0676288 1.4076240 1.5104243 0.9658026 1.0831367
 [78] 1.1124997 1.0736251 1.0706408 1.0812135 0.9577108 1.0108152 1.1717951
 [85] 1.0061784 1.1694154 1.1846015 1.1769767 1.5418801 0.9668056 1.0229758
 [92] 1.0163919 1.0067382 1.1416816 1.0529011 1.2457299 1.2071117 1.2058496
 [99] 1.0280270 1.1206790 1.4628332 1.0746957 1.0852634 1.0256533 0.9968473
[106] 0.9962769 1.0502115 1.0802879 1.0630045 1.0736103 1.1381173 1.3711259
[113] 1.2264361 0.9957602 1.0239269 1.0535575 1.0150386 1.0391366 0.9679474
[120] 1.2176835 1.1525401 0.9477964 1.4738389 1.0518386 1.0198236 1.2407577
[127] 0.9934633 1.1656344 1.0499676 1.0742152 1.1371228 1.2324957 0.9862647
[134] 1.3666483 1.0094264 0.9823569 1.2028485 1.0197210 1.1697091 1.0396374
[141] 1.0334162 1.1762952 1.0693904 1.0656376 0.9959369 1.1428813 1.0270046
[148] 1.0740332 1.0468706 1.2855804 0.9687835 1.1302654 1.1504649 1.0778851
[155] 1.1877926 1.3005585 1.0708508 1.0631956 1.0732828 1.0365309 1.1740153
[162] 1.0025050 1.1547076 1.1937634 0.9540287 0.9909122 0.9836126 1.0280822
[169] 0.9926560 1.2893676 0.9686671 0.9698241 1.0336962 0.9870936 1.0725949
[176] 0.9889973 1.0606044 2.1470520 1.1117526 1.0809804 1.0669484 1.1573459
[183] 0.9694036 1.0003779 1.0346715 0.9865159 1.0154331 0.9475537 0.9680811
[190] 1.0633009 1.0156975 1.0425740 1.1076161 2.1832763 1.1825899 1.0332927
[197] 1.5195260 1.5220584 1.1082895 1.0657852 0.9789148 1.0537626 1.3913338
[204] 0.9775001 1.1533966 1.0381523 1.1189367 1.0633206 1.0955212 0.9519101
[211] 1.0461916 0.9773528 1.4214864 1.1221510 1.1834890 1.1589980 1.1951508
[218] 0.9788653 1.1209928 0.9910101 1.1691297 1.0011421 1.0592344 1.1116422
[225] 0.9750191 1.0249530 1.1176434 1.0457265 1.0368464 1.0118330 0.9969890
[232] 1.0168517 1.3869926 1.0795345 1.0305744 1.0599677 1.0300674 1.0847168
[239] 1.2458694 0.9644580 1.0421286 1.0465804 0.9960198 1.1140534 1.3057864
[246] 1.0189729 1.5879464 0.9779654 1.0914103 1.4754569 1.1711756 1.0714178
[253] 1.2112567 1.1995703 1.0295419 0.9920993 1.0742186 1.0513704 1.0098368
[260] 1.0050542 1.1914604 1.1018260 1.1132983 1.0251593 1.0661826 1.0259277
[267] 1.0645328 1.2211775 1.0861148 1.1667462 1.0865794 1.0041540 1.6563323
[274] 1.1940458 1.3575785 1.0215727 1.0288365 0.9865635 1.1249253 1.0290627
[281] 1.0798205 1.0271255 1.2293948 1.0180029 1.1102168 1.2238821 1.0157995
[288] 0.9998633 1.1401227 0.9893848 1.0206718 1.0327893 1.0878661 1.2052764
[295] 1.1323218 1.1856236 1.2311077 1.0441340 1.4116021 1.1079703 1.0639319
[302] 0.9972393 1.2530706 0.9792568 1.0885027 0.9837129 1.2805901 1.0854663
[309] 1.2373127 1.0051696 0.9789228 1.0302750 1.0439802 1.0604804 1.0707399
[316] 0.9794395 1.1984140 1.1759195 1.1114498 1.1442638 0.9890306 1.1023983
[323] 1.0749377 1.0614604 1.4017453 1.0830941 0.9959134 1.2581817 1.0420252
[330] 0.9737738 1.1980362 1.0516272 1.0734150 1.0746832 1.1164682 1.1438125
[337] 1.2199341 0.9899200 0.9853924 1.1313562 1.0079452 1.0595410 1.0208347
[344] 0.9883661 1.1171472 0.9489955 1.0640849 1.1210809 1.2659536 1.4330912
[351] 1.1074596 0.9960481 1.6642446 1.4012095 1.0128007 1.0500321 1.0135715
[358] 1.1357871 1.0707593 1.1897634 0.9789952 1.0154332 0.9876350 0.9688104
[365] 1.0721112 0.9934443 1.0496790 0.9713017 1.0001270 1.0120549 1.0038661
[372] 1.0005626 1.0178910 1.0135891 1.0185696 1.0384623 0.9815941 1.3863288
[379] 1.0313211 1.0329556 1.2344493 1.0391700 1.0826997 2.3766198 1.0631745
[386] 1.3105522 1.1466843 1.3977457 1.0296741 1.0116508 1.1184228 1.1961474
[393] 0.9964584 1.3788771 0.9931989 1.3541214 1.1126376 1.0272965 1.0012309
[400] 0.9731260 1.4158861 1.1421120 1.0155752 1.1474051 1.0419812 1.0124575
[407] 1.0494842 1.0090038 1.0187066 0.9458617 1.0652896 1.0919277 1.1179943
[414] 0.9404104 1.1900321 1.1774727 1.0284449 0.9894965 1.0029411 1.0778825
[421] 0.9556030 0.9536904 1.1259135 1.0412918 1.1549697 1.1458237 0.9753186
[428] 0.9825774 1.0436665 1.0022964 1.5989734 0.9962202 0.9788296 1.0284449
[435] 0.9930905 1.0843631 1.1178609 1.1266227 1.5034933 1.1321813 1.5089696
[442] 1.2497667 1.2901657 1.2175143 0.9620418 1.2975895 0.9699311 1.1696565
[449] 1.0708339 1.0020215 1.1019225 1.0694767 0.9586025 0.9832882 1.0932057
[456] 1.0548738 1.0701717 0.9700732 1.7353599 1.1446203 0.9792117 1.2331312
[463] 1.0124469 1.0916133 1.1525612 0.9753018 0.9247022 1.1459138 1.0884558
[470] 1.2911948 1.2990285 1.0532174 1.0079381 1.0204328 1.2143426 0.9194012
[477] 1.0643858 1.4795321 0.9823536 1.0873287 1.0581524 1.1530363 1.0409305
[484] 1.1007027 1.1163551 1.0625591 1.0052961 1.0763650 1.2463965 1.3009043
[491] 1.0068408 1.0753856 1.1172068 1.1758890 1.0087129 1.0972053 1.0442478
[498] 1.0175910 1.0004130 1.2091480 0.9602400 1.0864518 1.0040722 1.0792291
[505] 1.0174216 1.1788066 1.1971765 0.9626137 1.2357163 1.6359778 1.1471212
[512] 1.0056905 1.1663942 1.1276508 0.9976199 1.0614014 0.9821226 1.1172701
[519] 2.3471313 1.0024724 1.1779960 1.0573396 0.9566965 1.1233991 0.9816086
[526] 1.0115947 0.9986028 1.1169284 0.9630803 1.2134142 1.1706685 1.0949218
[533] 0.9986390 0.9746018 1.3752763 1.0364850 1.0193220 1.0560562 1.0566711
[540] 1.2865625 1.0731159 1.0625169 1.0893763 1.0278224 1.0142736 0.9877350
[547] 1.1437764 0.9817936 1.0606125 1.0950251 1.2062820 1.0104950 0.9739338
[554] 0.9966809 1.3747032 1.1095626 2.1257001 1.1234883 1.1131744 1.0236047
[561] 1.0599764 1.0267818 1.2480118 1.0056905 1.0087045 0.9517038 1.1489785
[568] 1.1184845 0.9963635 1.0322645 1.1363591 0.9700391 1.2283149 1.1695911
[575] 1.1451794 1.0279182 1.1751175 1.0562295 1.0371651 1.0091871 1.4378770
[582] 1.1861843 1.1519017 0.9682412 1.0294356 1.2931467 1.0155394 1.0255742
[589] 1.2445296 1.0181336 0.9821873 0.9692669 1.0242226 1.0912432 0.9934558
[596] 1.1686367 1.0649895 1.0039220 0.9707033 1.1077785 1.1475657 1.0276672
[603] 1.2129491 1.1500943 0.9947879 0.9630827 0.9900905 1.0252108 0.9872843
[610] 1.0117657 0.9951085 1.0900170 1.2224520 1.0813983 2.1555338 0.9844731
[617] 1.1826128 0.9834504 1.0554456 1.2577232 1.0446899 1.6066306 0.9912528
[624] 1.1187347 1.1009329 1.2801312 1.0179860 1.0543218 1.1161367 0.9427220
[631] 1.0236696 0.9876671 1.1600901 1.0281879 0.9980802 1.0376068 1.0733577
[638] 1.0990370 1.1307911 1.1005764 1.0960313 1.1040445 0.9821452 1.0273464
[645] 1.1484909 1.0173624 0.9876561 0.9685039 1.1512800 0.9942942 1.1489182
[652] 1.1053965 1.0479336 0.9460273 1.1420777 1.2220973 1.2346467 1.0714846
[659] 0.9983472 1.1588064 1.4987104 1.0685801 1.0292575 1.3704660 0.9829010
[666] 0.9487593 1.0942914 1.0032657 0.9650712 1.1344317 1.0944913 1.0106733
[673] 1.1050425 1.0496930 1.2729420 1.0965540 1.0584036 1.1003004 1.2226515
[680] 0.9423331 0.9790350 1.1612456 1.0500076 1.4471738 1.3128500 1.2194067
[687] 1.0566039 0.9722244 1.0245932 1.0717563 0.9795465 0.9873585 1.1451877
[694] 1.0276499 1.4153429 1.1110442 1.3059418 0.9540525 0.9653414 1.2203146
[701] 1.0239017 0.9748029 1.1051421 1.0258214 1.2456765 1.0257716 1.2223825
[708] 0.9823074 1.2060696 1.1895847 1.0085060 0.9921927 1.0760168 1.1316207
[715] 0.9862647 0.9692145 1.0915659 0.9853055 0.9510732 0.9591156 0.9973802
[722] 1.0215291 1.2669778 0.9737486 1.1322836 1.0440040 1.0987594 1.1774753
[729] 1.1929588 1.0327467 0.9668056 1.0764242 0.9340649 1.1022360 0.9998815
[736] 1.0588302 1.0023197 0.9896798 0.9980802 1.0384001 0.9823569 1.0205971
[743] 1.0218441 1.0725195 1.0327824 1.2533569 1.1503306 1.0310051 0.9839333
[750] 1.2823896 1.0338090 1.4243049 1.2013651 1.0119204 1.0013705 1.1398175
[757] 1.6309866 1.0415395 1.0108084 1.0793125 1.1021220 1.0046949 1.1480995
[764] 1.1623742 0.9910984 1.0088878 0.9752702 0.9730229 0.9483735 1.0058512
[771] 1.0239589 1.0605135 0.9922569 1.1594191 1.0213126 0.9902452 1.2376011
[778] 1.8516346 1.1208274 0.9934443 1.1471038 1.1489785 1.0012056 1.1376997
[785] 1.0056467 1.0732695 1.0429702 1.0583735 1.0115659 1.1199684 1.1364054
[792] 1.0590539 1.7176950 1.1226708 1.1256552 1.0432969 0.9582983 1.1031887
[799] 1.2358108 0.9888672 1.0312555 1.0268323 1.0015096 1.0113848 1.1880003
[806] 1.0115488 1.1433380 1.1998177 0.9600576 1.0116993 0.9926603 1.1776702
[813] 1.1841405 1.2226268 1.0152168 1.2101442 1.0198824 1.2069927 1.0253249
[820] 1.0251705 1.0359450 1.1081893 1.1321682 1.0763416 0.9616326 1.0328903
[827] 1.2283078 1.5590866 1.0971920 1.1227816 0.9895505 1.0537163 0.9466942
[834] 1.3441895 1.0080264 0.9852244 1.1247871 1.2604309 1.0050661 1.1684418
[841] 1.0257958 1.0108942 1.0149998 1.0245932 0.9533554 1.0545463 0.9623975
[848] 0.9987876 0.9681013 1.0105088 1.0313181 1.3005880 1.0271783 1.0825398
[855] 1.0068129 1.2119427 1.0268090 1.0039220 1.0471784 1.0549344 1.0861484
[862] 1.1293772 1.0875092 1.0324494 0.9734243 0.9964584 1.5191343 0.9545512
[869] 1.1608242 1.6240765 1.1567978 1.0136996 1.2856696 1.0594114 1.2033427
[876] 1.2471671 1.0154332 1.0346429 1.0236681 0.9742859 0.9771008 1.0319874
[883] 0.9754850 1.0379172 1.0898494 0.9482523 1.0377576 1.0366396 1.0100307
[890] 1.0882434 1.1893598 1.1076897 1.0447504 0.9896456 1.3099098 1.2243051
[897] 1.0682616 0.9594786 1.2820201 1.3293676 1.0309464 1.0298003 1.2289601
[904] 1.0876884 1.0097298 1.0423656 1.1104567 1.1111636 1.2375285 1.0224295
[911] 1.0624141 1.0971723 1.0444423 1.1663449 1.4997174 0.9736167 0.9418714
[918] 1.1396198 1.0036048 1.1132111 1.5151813 0.9726774 0.9470529 1.1050760
[925] 1.1390816 1.2334873 0.9568957 1.0805402 1.0593814 0.9508547 1.0654632
[932] 1.0648920 1.2361659 1.0100049 1.0810281 0.9808794
data_num_con$lof <- lof_resultados_2 #añadimos la variable lof al conjunto de datos original


# Los que tienen un LOF mayor de 1.5
lof_significativos_2 <- 
  data_num_con |> 
  filter(lof > 1.5) |> 
  relocate(lof, .before = "EDAD") #para que se pueda observar bien en el html

lof_significativos_2
# A tibble: 28 × 6
     lof  EDAD TARHOGENTREV_HH ESCFEMINIS ESCIDEOL CUIDADOHIJOS_HH
   <dbl> <dbl>           <dbl>      <dbl>    <dbl>           <dbl>
 1  1.50    47               1          2        5               0
 2  1.57    64               2          9        1               1
 3  1.51    48               5          4        4               4
 4  1.54    48               1          5       10               8
 5  2.15    25               8         10        5               0
 6  2.18    37              15          5        5              19
 7  1.52    43               4          6        1               2
 8  1.52    48               5          4        9               4
 9  1.59    52               1         10       10               4
10  1.66    52               3         10        3              12
# ℹ 18 more rows
ggplot(data_num_con, aes(y = lof)) +
  geom_boxplot(fill = "skyblue", outlier.color = "red", outlier.shape = 16) +
  theme_minimal() +
  labs(title = "Distribución de LOF Scores")

min(lof_significativos_2$lof)
[1] 1.502268
max(lof_significativos_2$lof)
[1] 2.37662

Este gráfico es útil para entender cómo se distribuyen los outliers en dos variables, pero no refleja todo el análisis de LOF. LOF funciona en el espacio multidimensional, considerando todas las variables al mismo tiempo. Para poder visualizarlo vamos a dejar una variable fija y a representarla de manera bidimensional con el resto de variables(en este caso solo tenemos 4 cuantitativas).

#las cuantitativas
ggplot(data_num_con, aes(x = EDAD, y = ESCFEMINIS, colour = lof)) +
  geom_point() +
  scale_color_gradient(low = "blue", high = "red", name = "LOF Score") +
  labs(title = "Detección de Valores Atípicos con LOF")

ggplot(data_num_con, aes(x = TARHOGENTREV_HH, y = ESCFEMINIS, colour = lof)) +
  geom_point() +
  scale_color_gradient(low = "blue", high = "red", name = "LOF Score") +
  labs(title = "Detección de Valores Atípicos con LOF")

ggplot(data_num_con, aes(x = ESCIDEOL, y = ESCFEMINIS, colour = lof)) +
  geom_point() +
  scale_color_gradient(low = "blue", high = "red", name = "LOF Score") +
  labs(title = "Detección de Valores Atípicos con LOF")

ggplot(data_num_con, aes(x = CUIDADOHIJOS_HH, y = ESCFEMINIS, colour = lof)) +
  geom_point() +
  scale_color_gradient(low = "blue", high = "red", name = "LOF Score") +
  labs(title = "Detección de Valores Atípicos con LOF")

La escala de color me muestra los LOF MÁS significativos que ahora comentaremos.

Conclusiones LOF

Aunque el algoritmo LOF ha detectado algunas observaciones con puntuaciones por encima de 1.5, en ambos análisis (con y sin la variable de cuidado de hijos/as), los valores se mantienen dentro de un rango moderado, moviéndose entre 1.5 y algo más de 2.

#sin hijos
min(lof_significativos$lof)
[1] 1.50238
max(lof_significativos$lof)
[1] 2.00844
#con hijos
min(lof_significativos_2$lof)
[1] 1.502268
max(lof_significativos_2$lof)
[1] 2.37662
  • Esto significa que, si bien hay observaciones que se alejan ligeramente del patrón general, no encontramos casos extremos que se desmarquen claramente del resto. Por tanto, no consideramos que haya observaciones atípicas graves que deban ser eliminadas.

  • En vez de eliminar todo lo que supere el umbral de 1.5, lo que hemos hecho es observar cuáles se separan mucho del resto, y al ver que no hay grandes saltos, decidimos mantener todos los casos, ya que aportan información útil.

#sin hijos
lof_significativos
# A tibble: 62 × 5
     lof  EDAD TARHOGENTREV_HH ESCFEMINIS ESCIDEOL
   <dbl> <dbl>           <dbl>      <dbl>    <dbl>
 1  1.50    21               1         10       10
 2  1.96    67               3          2        5
 3  1.51    32               2         10        6
 4  1.58    36               8          8        5
 5  1.65    25               1         10       10
 6  1.74    83              12          5        5
 7  1.60    36               6          0        4
 8  1.58    70              12          5       10
 9  1.57    58               7          5        1
10  1.74    39               2          1        2
# ℹ 52 more rows
#con hijos
lof_significativos_2
# A tibble: 28 × 6
     lof  EDAD TARHOGENTREV_HH ESCFEMINIS ESCIDEOL CUIDADOHIJOS_HH
   <dbl> <dbl>           <dbl>      <dbl>    <dbl>           <dbl>
 1  1.50    47               1          2        5               0
 2  1.57    64               2          9        1               1
 3  1.51    48               5          4        4               4
 4  1.54    48               1          5       10               8
 5  2.15    25               8         10        5               0
 6  2.18    37              15          5        5              19
 7  1.52    43               4          6        1               2
 8  1.52    48               5          4        9               4
 9  1.59    52               1         10       10               4
10  1.66    52               3         10        3              12
# ℹ 18 more rows

Aunque no veamos una distancia muy grande entre los valores LOF, vemos que los valores más altos de LOF corresponden a los valores de los extremos de la variable TARHOGARENTREV_HH, la cual hemos decidido que los vamos a quitar. El lof ha sido capaz de corroborar las hipótesis que hemos sacado en el bivariante. Pero no quitaremos toda la observación porque hemos identificado los valores que la están haciendo rara, quitamos esos valores y ya.

Important
  • Una vez hecho este proceso podemos ya quitar los extremos detectados en el bivariante y confirmados en el lof, los pasamos a na.
data_num <- 
  data_num |> 
  mutate(TARHOGENTREV_HH = if_else(TARHOGENTREV_HH >= 10, NA, TARHOGENTREV_HH))

Tratamiento de Ausentes 🧩

Análisis inicial

  • Gráficamente
gg_miss_var(data_num, show_pct = TRUE)

vis_miss(data_num)

  • Cuantificamos
n_miss(data_num)
[1] 4836
pct_miss(data_num)
[1] 6.708281
pct_complete_case(data_num)
[1] 18.70162

Este análisis muestra que solo un 18% de los casos están completos, es decir, sin ningún valor perdido. Eso significa que si nos quedamos solo con los casos completos, perderíamos más del 80% de los datos, lo cual es una barbaridad. Por eso, la imputación es clave

Análisis de cualitativas

Visualizamos

#Sexo
gg_miss_var(data_num, show_pct = TRUE, facet = SEXO)

#TAMUNI
gg_miss_var(data_num, show_pct = TRUE, facet = TAMUNI)

#INGRESHOG
gg_miss_var(data_num, show_pct = TRUE, facet = INGRESHOG)

#HIJOMENOR
gg_miss_var(data_num, show_pct = TRUE, facet = HIJOMENOR)

#SITLAB
gg_miss_var(data_num, show_pct = TRUE, facet = SITLAB)

#NIVELESTENTREV
gg_miss_var(data_num, show_pct = TRUE, facet = NIVELESTENTREV)

#GRADACDISC
gg_miss_var(data_num, show_pct = TRUE, facet = GRADACDISC)

#GRADODESIGUALDAD
gg_miss_var(data_num, show_pct = TRUE, facet = GRADODESIGUALDAD)

#VALSALARIOS
gg_miss_var(data_num, show_pct = TRUE, facet = VALSALARIOS)

#VALPOSASC
gg_miss_var(data_num, show_pct = TRUE, facet = VALPOSASC)

#VALOPEMP
gg_miss_var(data_num, show_pct = TRUE, facet = VALOPEMP)

#RELIGION
gg_miss_var(data_num, show_pct = TRUE, facet = RELIGION)

#RECUVOTOG
gg_miss_var(data_num, show_pct = TRUE, facet = RECUVOTOG)

  • Hemos detectado que la variable recuvotog es mnar ya que muestra una asociación pero no sabemos explicarla del todo. Además si nos fijamos vemos que hay muchos más missings de los que debería haber si solo hubiesemos pasados a nas “no recuerda”. Esto se debe a que el valor cero en esa variable cosrresponde a todos los que no habían votado y no venía especificada en el pdf de las etiquetas y el cuestionario, por lo que en el factor se han ido a nas.
Note
  • Un mnar depende de variables “ocultas” en los datos que no tenemos en el dataset. Este es un claro ejemplo. En este caso, al disponer de la encuesta entera hemos detectado que estos mnar están relacionados con no haber votado en las últimas elecciones, lo cual viene recogido en otra variable de la encuesta que no está incluida en nuestro dataset.

Imputación Cualis < 5%

prop.table(table(data_num$NIVELESTENTREV,useNA = "always"))

 Menos de 5 años escolarización                        Primaria 
                    0.005992509                     0.039200999 
                      FP básica            Educación secundaria 
                    0.003495630                     0.122846442 
                 FP grado medio                    Bachillerato 
                    0.067665418                     0.146067416 
              FP grado superior Arquitectura/ingeniería técnica 
                    0.129088639                     0.018976280 
         Diplomaturas oficiales             Grado universitario 
                    0.071161049                     0.061173533 
                   Licenciatura         Arquitectura/ingeniería 
                    0.158302122                     0.030961298 
                 Máster oficial                       Doctorado 
                    0.093383271                     0.023470662 
       Títulos propios posgrado                  Otros estudios 
                    0.012234707                     0.008739076 
                           <NA> 
                    0.007240949 
#sustituimos los NAs por el valor mas repetido, la moda
data_num$NIVELESTENTREV_imp <-data_num$NIVELESTENTREV
data_num$NIVELESTENTREV_imp[is.na(data_num$NIVELESTENTREV_imp)] <-
  "Licenciatura"


prop.table(table(data_num$GRADACDISC,useNA = "always"))

    Nada de acuerdo     Poco de acuerdo             Regular Bastante de acuerdo 
        0.325343321         0.275156055         0.009238452         0.194257179 
     Muy de acuerdo                <NA> 
        0.188264669         0.007740325 
#sustituimos los NAs por el valor mas repetido, la moda
data_num$GRADACDISC_imp <-data_num$GRADACDISC
data_num$GRADACDISC_imp[is.na(data_num$GRADACDISC_imp)] <-
  "Nada de acuerdo"


prop.table(table(data_num$GRADODESIGUALDAD,useNA = "always"))

Casi inexistentes          Pequeñas  Bastante grandes       Muy grandes 
       0.13533084        0.26067416        0.41972534        0.15880150 
             <NA> 
       0.02546816 
#sustituimos los NAs por el valor mas repetido, la moda
data_num$GRADODESIGUALDAD_imp <-data_num$GRADODESIGUALDAD
data_num$GRADODESIGUALDAD_imp[is.na(data_num$GRADODESIGUALDAD_imp)] <-
  "Bastante grandes"


prop.table(table(data_num$VALSALARIOS,useNA = "always"))

      Peor      Igual      Mejor       <NA> 
0.61548065 0.33033708 0.03470662 0.01947566 
#sustituimos los NAs por el valor mas repetido, la moda
data_num$VALSALARIOS_imp <-data_num$VALSALARIOS
data_num$VALSALARIOS_imp[is.na(data_num$VALSALARIOS_imp)] <-
  "Peor"


prop.table(table(data_num$VALPOSASC,useNA = "always"))

      Peor      Igual      Mejor       <NA> 
0.58926342 0.32384519 0.06666667 0.02022472 
#sustituimos los NAs por el valor mas repetido, la moda
data_num$VALPOSASC_imp <-data_num$VALPOSASC
data_num$VALPOSASC_imp[is.na(data_num$VALPOSASC_imp)] <-
  "Peor"


prop.table(table(data_num$VALOPEMP,useNA = "always"))

      Peor      Igual      Mejor       <NA> 
0.46217228 0.43220974 0.08913858 0.01647940 
#sustituimos los NAs por el valor mas repetido, la moda
data_num$VALOPEMP_imp <-data_num$VALOPEMP
data_num$VALOPEMP_imp[is.na(data_num$VALOPEMP_imp)] <-
  "Peor"
vis_miss(data_num)

  • Aquí vemos como la imputación por la moda para estas variables cualitativas a funcionado pues ninguna de las imputadas presenta ningún ausente en el vis_miss.

Análisis de cuantitativas

Visualizamos

marginplot(data_num[c("EDAD","TARHOGENTREV_HH")])

ggplot(data = data_num, aes (x = EDAD, y = TARHOGENTREV_HH )) + geom_miss_point()

ggplot(data = data_num, aes (x = CUIDADOHIJOS_HH , y = TARHOGENTREV_HH )) + geom_miss_point()

marginplot(data_num[c("CUIDADOHIJOS_HH","TARHOGENTREV_HH")])

ggplot(data = data_num, aes (x = ESCFEMINIS  , y = TARHOGENTREV_HH )) + geom_miss_point()

marginplot(data_num[c("ESCFEMINIS","TARHOGENTREV_HH")])

ggplot(data = data_num, aes (x = ESCIDEOL   , y = TARHOGENTREV_HH )) + geom_miss_point()

marginplot(data_num[c("ESCIDEOL","TARHOGENTREV_HH")])

  • Tras la elaboración de los gráficos correspondientes a las tres variables continuas analizadas, se ha llegado a una conclusión común: los datos faltantes en estas variables parecen corresponderse con un mecanismo de tipo MCAR (Missing Completely At Random). Esta conclusión se fundamenta en que no se observa una relación evidente entre la ausencia de datos y otras variables del conjunto; es decir, los datos faltantes son independientes del resto de la información disponible.

  • Esta independencia se evidencia claramente en los margin plots, donde los boxplots se mantienen a una altura similar en las comparaciones, indicando que la distribución de los valores observados no cambia en función de la presencia o ausencia de datos. Aunque en algunos gráficos pueden percibirse ligeras asociaciones, un análisis más detallado revela que estas se deben a una mayor concentración general de observaciones en ciertas zonas del gráfico, y no a una relación directa con la falta de datos. Por lo tanto, concluimos que no existe una asociación sistemática que explique los valores faltantes.

  • Como estamos con variables continuas con un un bajo % de missings vamos a imputar por la media.

Imputación cuantis

#TARHOGENTREV_HH_media
data_num$TARHOGENTREV_HH_media <- ifelse(
  is.na(data_num$TARHOGENTREV_HH),
  mean(data_num$TARHOGENTREV_HH, na.rm = TRUE),
  data_num$TARHOGENTREV_HH
)
#ESCIDEOL_media
data_num$ESCIDEOL_media<-data_num$ESCIDEOL
mean(data_num$ESCIDEOL, na.rm = TRUE)
[1] 4.770003
data_num$ESCIDEOL_media[is.na(data_num$ESCIDEOL_media)] <- mean(data_num$ESCIDEOL_media, na.rm = TRUE)

#ESCFEMINIS_media
data_num$ESCFEMINIS_MEDIA<-data_num$ESCFEMINIS
mean(data_num$ESCFEMINIS, na.rm = TRUE)
[1] 6.266599
data_num$ESCFEMINIS_MEDIA[is.na(data_num$ESCFEMINIS_MEDIA)] <- 
  mean(data_num$ESCFEMINIS_MEDIA, na.rm = TRUE)
  • Vemos si se ajusta bien a la distribucion
#TARHOGENTREV_HH

ggplot(data_num) + geom_density(aes(x = TARHOGENTREV_HH, fill = "Original"), alpha = 0.5) + geom_density(aes(x = TARHOGENTREV_HH_media, fill = "Imputado"), alpha = 0.5) + scale_fill_manual(values = c("Original" = "blue", "Imputado" = "red")) + labs(title = "Comparación de densidades: Original vs. Imputado", x = "TARHOGENTREV_HH", y = "Densidad", fill = "Tipo de dato") + theme_minimal()
Warning: Removed 244 rows containing non-finite outside the scale range
(`stat_density()`).

#ESCFEMINIS
ggplot(data_num, aes(x = ESCFEMINIS, fill = "Age")) +
geom_density(alpha = 0.5) +
geom_density(aes(x = ESCFEMINIS_MEDIA, fill = "Age_media"),alpha=0.5)
Warning: Removed 59 rows containing non-finite outside the scale range
(`stat_density()`).

#ESCIDEOL
ggplot(data_num, aes(x = ESCIDEOL, fill = "ESCIDEOL")) +
geom_density(alpha = 0.5) +
geom_density(aes(x = ESCIDEOL_media, fill = "ESCIDEOL_media"),alpha=0.5)
Warning: Removed 218 rows containing non-finite outside the scale range
(`stat_density()`).

  • En los gráficos presentados se comparan las distribuciones originales de las variables con las distribuciones resultantes tras la imputación. Se observa que, en todo momento, ambas se ajustan de forma bastante precisa, lo que indica que el proceso de imputación ha sido adecuado. Las imputaciones realizadas no alteran significativamente el comportamiento ni la forma de la distribución original, lo cual sugiere que los valores imputados mantienen la coherencia con los datos observados y no introducen sesgos visibles en la estructura de los datos.

Imputación Múltiple

Las variables cualitativas con un porcentaje de valores perdidos superior al 5% serán imputadas mediante el algoritmo MICE (Multiple Imputation by Chained Equations), dado que permite una imputación adecuada respetando la naturaleza categórica de los datos.

metodos <- c(
  SEXO = "", 
  EDAD = "", 
  TAMUNI = "", 
  INGRESHOG = "cart", 
  TARHOGENTREV_HH = "", 
  HIJOMENOR = "", 
  SITLAB = "", 
  NIVELESTENTREV = "", 
  GRADACDISC = "", 
  GRADODESIGUALDAD = "", 
  VALSALARIOS = "", 
  VALPOSASC = "", 
  VALOPEMP = "", 
  ESCFEMINIS = "", 
  ESCIDEOL = "", 
  RELIGION = "",
  RECUVOTOG = "cart"
)
impData <- mice(data_num |> select(
  -NIVELESTENTREV_imp,
  -GRADACDISC_imp,
  -GRADODESIGUALDAD_imp,
  -VALSALARIOS_imp,
  -VALPOSASC_imp,
  -VALOPEMP_imp,
  -TARHOGENTREV_HH_media,
  -ESCIDEOL_media,
  -ESCFEMINIS_MEDIA,
  -CUIDADOHIJOS_HH), m = 5, maxit = 50, seed = 500, method = metodos)

 iter imp variable
  1   1  INGRESHOG  RECUVOTOG
  1   2  INGRESHOG  RECUVOTOG
  1   3  INGRESHOG  RECUVOTOG
  1   4  INGRESHOG  RECUVOTOG
  1   5  INGRESHOG  RECUVOTOG
  2   1  INGRESHOG  RECUVOTOG
  2   2  INGRESHOG  RECUVOTOG
  2   3  INGRESHOG  RECUVOTOG
  2   4  INGRESHOG  RECUVOTOG
  2   5  INGRESHOG  RECUVOTOG
  3   1  INGRESHOG  RECUVOTOG
  3   2  INGRESHOG  RECUVOTOG
  3   3  INGRESHOG  RECUVOTOG
  3   4  INGRESHOG  RECUVOTOG
  3   5  INGRESHOG  RECUVOTOG
  4   1  INGRESHOG  RECUVOTOG
  4   2  INGRESHOG  RECUVOTOG
  4   3  INGRESHOG  RECUVOTOG
  4   4  INGRESHOG  RECUVOTOG
  4   5  INGRESHOG  RECUVOTOG
  5   1  INGRESHOG  RECUVOTOG
  5   2  INGRESHOG  RECUVOTOG
  5   3  INGRESHOG  RECUVOTOG
  5   4  INGRESHOG  RECUVOTOG
  5   5  INGRESHOG  RECUVOTOG
  6   1  INGRESHOG  RECUVOTOG
  6   2  INGRESHOG  RECUVOTOG
  6   3  INGRESHOG  RECUVOTOG
  6   4  INGRESHOG  RECUVOTOG
  6   5  INGRESHOG  RECUVOTOG
  7   1  INGRESHOG  RECUVOTOG
  7   2  INGRESHOG  RECUVOTOG
  7   3  INGRESHOG  RECUVOTOG
  7   4  INGRESHOG  RECUVOTOG
  7   5  INGRESHOG  RECUVOTOG
  8   1  INGRESHOG  RECUVOTOG
  8   2  INGRESHOG  RECUVOTOG
  8   3  INGRESHOG  RECUVOTOG
  8   4  INGRESHOG  RECUVOTOG
  8   5  INGRESHOG  RECUVOTOG
  9   1  INGRESHOG  RECUVOTOG
  9   2  INGRESHOG  RECUVOTOG
  9   3  INGRESHOG  RECUVOTOG
  9   4  INGRESHOG  RECUVOTOG
  9   5  INGRESHOG  RECUVOTOG
  10   1  INGRESHOG  RECUVOTOG
  10   2  INGRESHOG  RECUVOTOG
  10   3  INGRESHOG  RECUVOTOG
  10   4  INGRESHOG  RECUVOTOG
  10   5  INGRESHOG  RECUVOTOG
  11   1  INGRESHOG  RECUVOTOG
  11   2  INGRESHOG  RECUVOTOG
  11   3  INGRESHOG  RECUVOTOG
  11   4  INGRESHOG  RECUVOTOG
  11   5  INGRESHOG  RECUVOTOG
  12   1  INGRESHOG  RECUVOTOG
  12   2  INGRESHOG  RECUVOTOG
  12   3  INGRESHOG  RECUVOTOG
  12   4  INGRESHOG  RECUVOTOG
  12   5  INGRESHOG  RECUVOTOG
  13   1  INGRESHOG  RECUVOTOG
  13   2  INGRESHOG  RECUVOTOG
  13   3  INGRESHOG  RECUVOTOG
  13   4  INGRESHOG  RECUVOTOG
  13   5  INGRESHOG  RECUVOTOG
  14   1  INGRESHOG  RECUVOTOG
  14   2  INGRESHOG  RECUVOTOG
  14   3  INGRESHOG  RECUVOTOG
  14   4  INGRESHOG  RECUVOTOG
  14   5  INGRESHOG  RECUVOTOG
  15   1  INGRESHOG  RECUVOTOG
  15   2  INGRESHOG  RECUVOTOG
  15   3  INGRESHOG  RECUVOTOG
  15   4  INGRESHOG  RECUVOTOG
  15   5  INGRESHOG  RECUVOTOG
  16   1  INGRESHOG  RECUVOTOG
  16   2  INGRESHOG  RECUVOTOG
  16   3  INGRESHOG  RECUVOTOG
  16   4  INGRESHOG  RECUVOTOG
  16   5  INGRESHOG  RECUVOTOG
  17   1  INGRESHOG  RECUVOTOG
  17   2  INGRESHOG  RECUVOTOG
  17   3  INGRESHOG  RECUVOTOG
  17   4  INGRESHOG  RECUVOTOG
  17   5  INGRESHOG  RECUVOTOG
  18   1  INGRESHOG  RECUVOTOG
  18   2  INGRESHOG  RECUVOTOG
  18   3  INGRESHOG  RECUVOTOG
  18   4  INGRESHOG  RECUVOTOG
  18   5  INGRESHOG  RECUVOTOG
  19   1  INGRESHOG  RECUVOTOG
  19   2  INGRESHOG  RECUVOTOG
  19   3  INGRESHOG  RECUVOTOG
  19   4  INGRESHOG  RECUVOTOG
  19   5  INGRESHOG  RECUVOTOG
  20   1  INGRESHOG  RECUVOTOG
  20   2  INGRESHOG  RECUVOTOG
  20   3  INGRESHOG  RECUVOTOG
  20   4  INGRESHOG  RECUVOTOG
  20   5  INGRESHOG  RECUVOTOG
  21   1  INGRESHOG  RECUVOTOG
  21   2  INGRESHOG  RECUVOTOG
  21   3  INGRESHOG  RECUVOTOG
  21   4  INGRESHOG  RECUVOTOG
  21   5  INGRESHOG  RECUVOTOG
  22   1  INGRESHOG  RECUVOTOG
  22   2  INGRESHOG  RECUVOTOG
  22   3  INGRESHOG  RECUVOTOG
  22   4  INGRESHOG  RECUVOTOG
  22   5  INGRESHOG  RECUVOTOG
  23   1  INGRESHOG  RECUVOTOG
  23   2  INGRESHOG  RECUVOTOG
  23   3  INGRESHOG  RECUVOTOG
  23   4  INGRESHOG  RECUVOTOG
  23   5  INGRESHOG  RECUVOTOG
  24   1  INGRESHOG  RECUVOTOG
  24   2  INGRESHOG  RECUVOTOG
  24   3  INGRESHOG  RECUVOTOG
  24   4  INGRESHOG  RECUVOTOG
  24   5  INGRESHOG  RECUVOTOG
  25   1  INGRESHOG  RECUVOTOG
  25   2  INGRESHOG  RECUVOTOG
  25   3  INGRESHOG  RECUVOTOG
  25   4  INGRESHOG  RECUVOTOG
  25   5  INGRESHOG  RECUVOTOG
  26   1  INGRESHOG  RECUVOTOG
  26   2  INGRESHOG  RECUVOTOG
  26   3  INGRESHOG  RECUVOTOG
  26   4  INGRESHOG  RECUVOTOG
  26   5  INGRESHOG  RECUVOTOG
  27   1  INGRESHOG  RECUVOTOG
  27   2  INGRESHOG  RECUVOTOG
  27   3  INGRESHOG  RECUVOTOG
  27   4  INGRESHOG  RECUVOTOG
  27   5  INGRESHOG  RECUVOTOG
  28   1  INGRESHOG  RECUVOTOG
  28   2  INGRESHOG  RECUVOTOG
  28   3  INGRESHOG  RECUVOTOG
  28   4  INGRESHOG  RECUVOTOG
  28   5  INGRESHOG  RECUVOTOG
  29   1  INGRESHOG  RECUVOTOG
  29   2  INGRESHOG  RECUVOTOG
  29   3  INGRESHOG  RECUVOTOG
  29   4  INGRESHOG  RECUVOTOG
  29   5  INGRESHOG  RECUVOTOG
  30   1  INGRESHOG  RECUVOTOG
  30   2  INGRESHOG  RECUVOTOG
  30   3  INGRESHOG  RECUVOTOG
  30   4  INGRESHOG  RECUVOTOG
  30   5  INGRESHOG  RECUVOTOG
  31   1  INGRESHOG  RECUVOTOG
  31   2  INGRESHOG  RECUVOTOG
  31   3  INGRESHOG  RECUVOTOG
  31   4  INGRESHOG  RECUVOTOG
  31   5  INGRESHOG  RECUVOTOG
  32   1  INGRESHOG  RECUVOTOG
  32   2  INGRESHOG  RECUVOTOG
  32   3  INGRESHOG  RECUVOTOG
  32   4  INGRESHOG  RECUVOTOG
  32   5  INGRESHOG  RECUVOTOG
  33   1  INGRESHOG  RECUVOTOG
  33   2  INGRESHOG  RECUVOTOG
  33   3  INGRESHOG  RECUVOTOG
  33   4  INGRESHOG  RECUVOTOG
  33   5  INGRESHOG  RECUVOTOG
  34   1  INGRESHOG  RECUVOTOG
  34   2  INGRESHOG  RECUVOTOG
  34   3  INGRESHOG  RECUVOTOG
  34   4  INGRESHOG  RECUVOTOG
  34   5  INGRESHOG  RECUVOTOG
  35   1  INGRESHOG  RECUVOTOG
  35   2  INGRESHOG  RECUVOTOG
  35   3  INGRESHOG  RECUVOTOG
  35   4  INGRESHOG  RECUVOTOG
  35   5  INGRESHOG  RECUVOTOG
  36   1  INGRESHOG  RECUVOTOG
  36   2  INGRESHOG  RECUVOTOG
  36   3  INGRESHOG  RECUVOTOG
  36   4  INGRESHOG  RECUVOTOG
  36   5  INGRESHOG  RECUVOTOG
  37   1  INGRESHOG  RECUVOTOG
  37   2  INGRESHOG  RECUVOTOG
  37   3  INGRESHOG  RECUVOTOG
  37   4  INGRESHOG  RECUVOTOG
  37   5  INGRESHOG  RECUVOTOG
  38   1  INGRESHOG  RECUVOTOG
  38   2  INGRESHOG  RECUVOTOG
  38   3  INGRESHOG  RECUVOTOG
  38   4  INGRESHOG  RECUVOTOG
  38   5  INGRESHOG  RECUVOTOG
  39   1  INGRESHOG  RECUVOTOG
  39   2  INGRESHOG  RECUVOTOG
  39   3  INGRESHOG  RECUVOTOG
  39   4  INGRESHOG  RECUVOTOG
  39   5  INGRESHOG  RECUVOTOG
  40   1  INGRESHOG  RECUVOTOG
  40   2  INGRESHOG  RECUVOTOG
  40   3  INGRESHOG  RECUVOTOG
  40   4  INGRESHOG  RECUVOTOG
  40   5  INGRESHOG  RECUVOTOG
  41   1  INGRESHOG  RECUVOTOG
  41   2  INGRESHOG  RECUVOTOG
  41   3  INGRESHOG  RECUVOTOG
  41   4  INGRESHOG  RECUVOTOG
  41   5  INGRESHOG  RECUVOTOG
  42   1  INGRESHOG  RECUVOTOG
  42   2  INGRESHOG  RECUVOTOG
  42   3  INGRESHOG  RECUVOTOG
  42   4  INGRESHOG  RECUVOTOG
  42   5  INGRESHOG  RECUVOTOG
  43   1  INGRESHOG  RECUVOTOG
  43   2  INGRESHOG  RECUVOTOG
  43   3  INGRESHOG  RECUVOTOG
  43   4  INGRESHOG  RECUVOTOG
  43   5  INGRESHOG  RECUVOTOG
  44   1  INGRESHOG  RECUVOTOG
  44   2  INGRESHOG  RECUVOTOG
  44   3  INGRESHOG  RECUVOTOG
  44   4  INGRESHOG  RECUVOTOG
  44   5  INGRESHOG  RECUVOTOG
  45   1  INGRESHOG  RECUVOTOG
  45   2  INGRESHOG  RECUVOTOG
  45   3  INGRESHOG  RECUVOTOG
  45   4  INGRESHOG  RECUVOTOG
  45   5  INGRESHOG  RECUVOTOG
  46   1  INGRESHOG  RECUVOTOG
  46   2  INGRESHOG  RECUVOTOG
  46   3  INGRESHOG  RECUVOTOG
  46   4  INGRESHOG  RECUVOTOG
  46   5  INGRESHOG  RECUVOTOG
  47   1  INGRESHOG  RECUVOTOG
  47   2  INGRESHOG  RECUVOTOG
  47   3  INGRESHOG  RECUVOTOG
  47   4  INGRESHOG  RECUVOTOG
  47   5  INGRESHOG  RECUVOTOG
  48   1  INGRESHOG  RECUVOTOG
  48   2  INGRESHOG  RECUVOTOG
  48   3  INGRESHOG  RECUVOTOG
  48   4  INGRESHOG  RECUVOTOG
  48   5  INGRESHOG  RECUVOTOG
  49   1  INGRESHOG  RECUVOTOG
  49   2  INGRESHOG  RECUVOTOG
  49   3  INGRESHOG  RECUVOTOG
  49   4  INGRESHOG  RECUVOTOG
  49   5  INGRESHOG  RECUVOTOG
  50   1  INGRESHOG  RECUVOTOG
  50   2  INGRESHOG  RECUVOTOG
  50   3  INGRESHOG  RECUVOTOG
  50   4  INGRESHOG  RECUVOTOG
  50   5  INGRESHOG  RECUVOTOG

Visualizamos

##Complete Data
completeData <- complete(impData, 1)
# Graficar la distribución de la variable categórica antes y después de la imputación
par(mfrow = c(1, 2)) # Organizar las gráficas en una fila de 2 columnas
barplot(table(data_num$INGRESHOG, useNA = "ifany"), main = "Antes de la imputación")
barplot(table(completeData$INGRESHOG), main = "Después de la imputación")

# Graficar la distribución de la variable categórica antes y después de la imputación
par(mfrow = c(1, 2)) # Organizar las gráficas en una fila de 2 columnas
barplot(table(data_num$RECUVOTOG, useNA = "ifany"), main = "Antes de la imputación")
barplot(table(completeData$RECUVOTOG), main = "Después de la imputación")

  • Así es como nos quedaría la variable imputada. Vemos que no estamos distorsionando su distribución. Basatante bien.

BASE DE DATOS DEPURADA 🧹

write.csv(data_num, "base_depurada.csv", row.names = FALSE)
write.csv(completeData, "base_depurada_mice.csv", row.names = FALSE) #mice